Как искусственный интеллект изменит новостную журналистику
Медиа-эксперт Дэвид Касвелл рассказывает о том, почему генеративный искусственный интеллект может в корне изменить новостную экосистему, и как журналистам и новостным компаниям к этому адаптироваться.
Медиа-эксперт Дэвид Касвелл рассказывает о том, почему генеративный искусственный интеллект может в корне изменить новостную экосистему, и как журналистам и новостным компаниям к этому адаптироваться.
Дэвид Касвелл – консультант, разработчик и исследователь, специализирующийся на искусственном интеллекте в новостной журналистике. Дэвид руководил отделами внедрения инноваций в сфере новостных продуктов в BBC, Tribune Publishing и Yahoo!
Иллюстрация, созданная с помощью модели преобразования текста в изображение Midjourney 5.2 с использованием подсказки «Абстрактное изображение, представляющее неопределенное будущее цифровой журналистики в эпоху искусственного интеллекта».
***
Однако публичный релиз ChatGPT в конце ноября 2022 года продемонстрировал новые технологические возможности с таким очевидным и глубоким потенциальным влиянием на журналистику, что инновации, основанные на искусственном интеллекте, теперь находятся в центре внимания руководства почти в каждой редакции. Вся новостная индустрия задается вопросом: «Что дальше?»
Для многих журналистов первая половина 2023 года стала временем вопросов и знакомства с основами искусственного интеллекта.
На что способен ChatGPT? Что такое генеративный ИИ? Что такое языковая модель? Что такое «подсказка»? Насколько надежны эти инструменты? Какие навыки необходимы для их использования? Насколько быстро совершенствуется эта технология? Каковы риски? Насколько этот феномен реален, или всё это просто хайп?
Многие редакции пошли еще дальше: они обратились к сотрудникам и аудитории с заявлениями о том, как намерены намерены использовать генеративный ИИ в своих рабочих процессах и новостных продуктах. Некоторые даже начали в виде эксперимента публиковать статьи, написанные ChatGPT. Однако очень немногие из них предприняли конкретные шаги для практического и регулярного использования этих технологий. Идея перемен уже витает в воздухе, но конкретные инициативы пока встречаются редко.
За последние шесть месяцев я много времени посвятил обсуждению ИИ с высшим руководством сорока с лишним новостных агентств и веб-ресурсов в Азии, на Ближнем Востоке, в Латинской Америке, США, Европе и Великобритании. Среди моих собеседников были руководители крупнейших мировых СМИ.
Я сумел получить к ним доступ благодаря знакомству с инновациями в области ИИ и их прикладному использованию в крупных медиакомпаниях в США и Великобритании, а также благодаря моей скромной академической карьере, в ходе которой я изучал, как ранние принципы вычислений применялись в новостной индустрии.
Мой путь начался в Кремниевой долине десять с лишним лет назад, а исследовать семейства языковых моделей GPT я начал в 2019 году на Би-би-си. Внезапно сфера моих интересов, которая до появления GPT оставалась сравнительно нишевой, обратила на себя пристальное внимание многих крупных игроков в новостной индустрии.
В этой статье я обобщаю то, что вынес из наших дискуссий. Я рассмотрю возможности и потенциал генеративного ИИ и расскажу о том, как крупные новостные организации видят его стратегические и практические последствия.
Моя цель – способствовать тому, чтобы журналисты смогли выйти за рамки простой осведомленности в этих вопросах и перейти к конкретным инициативам, которые помогут им вступить в будущее, основанное на искусственном интеллекте.
Любая дискуссия о применении ИИ в журналистике носит отчасти спекулятивный характер, учитывая стремительные темпы развития функциональности ИИ. Тем не менее, некоторую ясность в эти вопросы можно внести.
Составить список того, что ваша редакция может делать с помощью ChatGPT, довольно легко. Гораздо сложнее четко определить, чего именно вы пытаетесь достичь с помощью генеративного ИИ, зачем вы пытаетесь этого достичь, как можно это реально сделать в масштабе рутинных и профессионально управляемых операций, и будет ли это достижение вообще оставаться актуальным, поскольку в ближайшие месяцы и годы ИИ фундаментально изменит конкурентную среду.
Я начну с обзора потенциальных стратегий использования ИИ в новостях, а затем перейду к вариантам практического внедрения ИИ в редакциях новостных агентств, а также к инфраструктурным и организационным требованиям, необходимым для поддержки этих вариантов. В конце статьи я изложу свою точку зрения на изменения, которых мы можем ожидать в новостной индустрии в долгосрочной перспективе.
1. Применение генеративного ИИ в новостной журналистике: продуктовая и редакционная стратегии
Стратегии, ориентированные на эффективность
Наиболее очевидные возможности применения генеративного ИИ в новостной журналистике заключаются в повышении эффективности конкретных и привычных шагов в рамках существующих рабочих процессов создания новостей. Стратегия «более эффективного создания существующих продуктов» привлекательна своей простотой, но ее преимущества почти наверняка будут недолговечными, поскольку она предполагает, что современная медиасреда сохранится в ее нынешней форме.
Однако вполне вероятно, что, по мере того, как использование генеративного ИИ станет повсеместным и будут появляться медиа-продукты на основе ИИ, радикально изменится абсолютно всё: конкурентная среда, процесс предложения продуктов, производственные рабочие процессы и бизнес-модели новостных организаций.
Первыми признаками этого служат:
эксперименты с генеративным поиском, которыми занимаются Google и Microsoft;
возможность пользовательского контроля потребительского опыта, которую предлагают запущенный основателями Instagram крупный агрегатор новостей Artifact и его аналоги;
планы по созданию базовой языковой модели на площадке X (Twitter 2.0);
и даже поведение десятков миллионов первых пользователей генеративных инструментов искусственного интеллекта, таких как ChatGPT и Midjourney, которые быстро научились использовать традиционные медиа в качестве материала для своего собственного самостоятельного потребления контента.
Стратегия «более эффективного производства существующих продуктов», очевидно, является разумной отправной точкой, но она не составляет принципиальную конкуренцию новому опыту на основе искусственного интеллекта и, следовательно, рискует со временем утратить актуальность.
Иллюстрация: Пользовательский контроль над восприятием текстовых новостных статей в приложении Artifact, в том числе в виде краткого изложения, упрощенного языка, стихотворения, языка поколения Z и аудиозаписей знаменитостей.
Стратегии расширения продукта
Более амбициозная стратегия ИИ для новостных организаций заключается в переосмыслении и расширении объема и масштаба новостных продуктов – с помощью методов, которые возможно использовать только благодаря генеративному ИИ. Эта стратегия – можем назвать ее «новые продукты для новой аудитории» – вероятно, будет более устойчивой, чем подход, ориентированный только на эффективность. Стратегия позволяет активно приспосабливаться к расширению выбора, который обеспечивает аудитории генеративный ИИ.
По сути, этот подход предполагает, что если генеративный ИИ предоставит аудитории больший контроль над опытом потребления новостей (как это впервые было реализовано в приложении Artifact), тогда информационные агентства смогут также предложить эту возможность напрямую пользователям. Если читатели новостей отныне могут решать, в каком формате они потребляют контент, то разве не должны они иметь возможность делать это в приложении или на веб-сайте издателя новостей?
Преимущество этой стратегии заключается в том, что она дает возможность конкурировать в развивающейся новостной экосистеме, основанной на искусственном интеллекте. При этом подобная экосистема продолжает использовать преимущества, которыми уже обладают традиционные СМИ – бренд, доверие к редакционным процессам и т. д.
Более того, конкуренция должна быть не просто нацелена на существующую целевую аудиторию, но может, благодаря новым журналистским продуктам, распространяться на совершенно новую аудиторию. Без генеративного ИИ это было бы невозможно.
Даже небольшие СМИ теперь могут предлагать комплексные мультимедийные новостные продукты разнообразной аудитории с разным потребительским поведением и предпочтениями.
Стратегии дифференциации
Стратегия создания новостного продукта в эпоху искусственного интеллекта обязательно будет направлена на дифференциацию контента и создание конкурентных преимуществ в виде эксклюзивных новостных продуктов, которые сумеют сохранять для аудитории уникальную ценность даже несмотря на изменение информационной экосистемы.
Реализация стратегии «уникальных продуктов» является сложной задачей, поскольку решение об уникальности продуктов редакции будет принимать аудитория, а не журналисты.
Стратегия дифференциации потенциально может хорошо сочетаться с некоторыми форматами традиционной журналистики, особенно если информационная экосистема начнет значительно уступать натиску контента, который генерирует ИИ.
Примеры уникальных продуктов:
создание собственных новостей с использованием специального доступа или специальных навыков;
богатый контекстуальный контент, полученный благодаря работе с архивами или в результате глубокого знакомства с предметом;
систематическое освещение конкретных предметных областей с использованием узкоспециализированных материалов (например, освещение местных новостей и отчеты о климатических изменениях).
Однако все эти возможности, вероятно, придется всесторонне оптимизировать с использованием генеративного ИИ, чтобы сохранить конкурентоспособность в информационной экосистеме, опосредованной ИИ.
Разработка форм дифференциации, вероятно, будет очень сложной задачей для многих новостных организаций, однако альтернативы в конечном итоге может и не быть.
Техно-редакторские стратегии
Аналогичная, но еще более амбициозная стратегия, доступная лишь немногим стартапам с большим финансированием или новостным агентствам с с солидными ресурсами, заключается в разработке собственных информационных технологий и услуг, ориентированных на новости – продуктов, которые могут напоминать в больше степени специализированные инструменты разведки, чем традиционные новостные продукты.
Этот подход, который можно назвать стратегией «техно-редакционного продукта», скорее всего, изменит соотношение между продуктом и редакционными функциями, которое в настоящее время существует в большинстве СМИ, требуя, чтобы редакционные операции поддерживали развитие продукта и бизнеса, а не наоборот.
Стратегия такого рода может включать разработку высокотехнологичных решений, таких как:
систематическая экстракция новостных событий (и, что особенно важно, новостных сюжетов) из огромных потоков текста и речи на естественном языке;
создание и поддержка собственных наборов данных в форме статей, а также систематическая сертификация этих новостей;
создание новых инструментов для изучения и контекстуализации сложных новостей.
Такие процессы и инструменты напоминают те, что используют правительственные разведывательные органы, поисковые системы, или процессы и инструменты, которые уже предлагают новостные организации, ориентированные на финансовых специалистов, но с гораздо более широким охватом и более привлекательные для аудитории.
Эта стратегия потребует исследовательской работы и значительных капиталовложений, которые будут окупаться за счет дорогих подписок. «Техно-редакционная» стратегия, возможно, не очень подходит для выпуска новостных продуктов, ориентированных на широкий охват, но, тем не менее, может стать важным компонентом информационной экосистемы, в которой повсеместно применяется генеративный ИИ.
Обучение собственной модели
Сейчас новостные организации активно ищут стратегические ответы на распространение генеративного искусственного интеллекта. Есть несколько вариантов, которые часто обсуждаются, но они могут оказаться менее привлекательными, чем кажется на первый взгляд. Одной из таких стратегий «осторожного подхода» является предварительное обучение собственной языковой модели с использованием архива редакции.
Вероятно, это плохая идея для большинства СМИ по нескольким причинам: здесь и проблемы с наймом талантливых специалистов экстра-класса в области машинного обучения, способных создать эффективную языковую модель, и крошечный размер архивов даже крупнейших новостных агентств по сравнению с объемом обучения языковой модели, и значительные затраты на периодическое переобучение, поддержку и эксплуатацию собственной языковой модели в условиях быстро совершенствующихся технологий.
Кроме того, обучение собственной модели дает мало явных преимуществ, даже если производительностью собственная модель не уступает коммерческой языковой модели или модели с открытым исходным кодом.
Вероятно, проблемы безопасности данных, привязки к поставщику или потребности в нишевом функционале можно решить гораздо более простыми способами, в том числе на договорной основе, с помощью точной настройки модели или использования модели с открытым исходным кодом.
Запатентованная модель, построенная на той же архитектуре преобразователя, что и большинство современных LLM, все равно будет страдать сбоями, даже если весь корпус данных для обучения безупречен.
Одно отдельно взятое СМИ едва ли сумеет создать решение, способное сравниться с продуктами технологических компаний, усилия которых направлены на повышение точности языковых моделей. Обучение собственной языковой модели может иметь смысл лишь в рамках отдельных специфических сценариев использования в некоторых СМИ, создающих особые информационные продукты. Пример такого продукта – мультимодальная модель «текст плюс финансовые данные» в Bloomberg. Но даже в таких случаях важно непредвзято и скрупулезно рассмотреть все затраты на реализацию этой стратегии и ее выгоду.
Создание чат-бота для архивов
Другая стратегия – «осторожного подхода» – которую реализуют или рассматривают некоторые СМИ, заключается в создании собственного чат-бота, который обеспечивает диалоговый интерактивный доступ к текущим новостям и архиву организации.
Этот вариант кажется привлекательным, учитывая успех ChatGPT. Однако в случае новостного чат-бота важно отдельно учитывать компонент интерфейса (т. е. интерактивный чат), информационный компонент (например, новости и их контекст) и базовую технологию, (например, LLM, большую языковую модель).
Несмотря на быстрое внедрение ChatGPT, текстовый или устный чат в качестве интерфейса по-прежнему не получил широкого признания как способ доступа к любому виду информации, не говоря уже о новостях. Аналитика аудитории для новостных бюллетеней, созданных для голосовых агентов, таких как Amazon Alexa и Google Home, разочаровывает, а первые попытки медиакомпаний использовать чат-боты с поддержкой LLM принесли мало трафика.
Это отсутствие успеха может быть – по крайней мере частично – связано с тем, что сами новости и архивы новостей не могут служить наборами данных, поддерживающими такой интерфейс, который для СМИ должен быть значительно меньшего объема и более однородным, чем гигантские наборы данных, которые использует ChatGPT или даже поисковая система.
Кроме того, с технологической точки зрения очень сложно воспроизвести гибкую природу общения с LLM, используя доступные в настоящее время методы создания чат-ботов из архивов, которые обычно включают в встроенную операцию поиска в сочетании с интерпретацией результатов языковой моделью.
Чат-бот либо слишком часто отвечает «я не знаю» на конкретные запросы, либо дает ссылки на заархивированные статьи с «максимальным соответствием» в отрыве от текущего контекста. Таким образом, он не может конкурировать с такими интернет-чат-ботами, как Bing Chat или Perplexity.ai.
Иллюстрация: Генеративный поиск Perpexity.aI по новостному запросу, объединяющий журналистику из нескольких источников новостей и социальных сетей.
Стратегия общения
Независимо от того, на каком этапе на пути к разработке стратегии реагирования на ИИ находится СМИ, крайне важно прежде всего довести подход организации к ИИ до заинтересованных сторон, спонсоров, сотрудников и аудитории.
Актуальность стратегического информирования об ИИ обусловлена тем, что каждый человек, связанный с новостной организацией, уже знает о возможностях этих инструментов и их потенциале. Большинство людей в новостной индустрии уже экспериментируют с этими инструментами, читают отчеты, оценивают потенциал и задают вопросы.
Конечно, было бы идеально терпеливо оценить ситуацию, тщательно разработать стратегию, создать план ее реализации, а затем сообщить об этой стратегии и плане – но сделать это быстро затруднительно.
Более практичная коммуникационная стратегия на этом этапе может состоять из признания ситуации, формулирования того, как организация взаимодействует с ИИ и изучает его, предоставления четких указаний по его раннему или ограниченному использованию, демонстрации новых подходов к инновациям, сигнализации способности к адаптации и общей подготовки к изменениям.. Также уместен тон оптимизма и воодушевления в связи с потенциалом ИИ, который поможет поднять журналистику над обычной информацией и сделать ее более доступной для гораздо большего числа людей.
Стратегический путь к сохранению актуальности
Общая цель почти всех новостных организаций в предстоящей трансформации, вызванной искусственным интеллектом, — это, грубо говоря, сохранение актуальности.
Новостные организации, независимо от того, финансируются ли они за счет рекламы, подписки, государственных фондов или благотворительности, будут стремиться оставаться актуальными и полезными для достаточно большого количества людей. Этот охват будет гарантировать, что механизмы финансирования продолжают функционировать.
Таким образом, задача предстоящего перехода к информационной экосистеме, опосредованной ИИ, состоит в том, чтобы пройти путь, который позволит использовать преимущества:
краткосрочных возможностей повышения эффективности;
среднесрочных возможностей для создания новых продуктов и услуг;
а также долгосрочных возможностей для переосмысления того, какими могут быть новости в трансформированной информационной экосистеме.
Очевидно, что этот путь сопряжен со значительным риском: в частности, с риском потери существующей ценности и неспособности создать новую ценность взамен. Следовательно, он может потребовать от руководителей и лидеров СМИ большей терпимости к риску. Развитие большей толерантности к риску (возможно, максимально близкой к той, которая есть у технологических компаний, инициировавших этот переход) может стать самым важным стратегическим шагом, который может совершить новостная организация.
2. Как внедрить генеративный искусственный интеллект в работе СМИ
От стратегии к проектам
Любая стратегия адаптации редакции к информационной экосистеме, определяемой генеративным искусственным интеллектом, бесполезна без конкретных практических проектов, которые позволяют этой стратегии приносить результаты.
Сформулировать такие проекты, очевидно, не так просто в наше время стремительных перемен, поскольку присутствует риск напрасных инвестиций, досадных ошибок или потенциального ущерба репутации бренда. Кроме того, проекты могут внести значимый вклад в стратегию только в том случае, если их можно применять в рутинных, повседневных операциях, а не просто в качестве тестируемых прототипов или демонстраций.
Поэтому, чтобы двигаться вперед, нам необходимо определить категории проектов, которые позволят СМИ подготовиться к будущему внедрению ИИ, минимизируя при этом риски, а также определить требования к инфраструктуре, необходимой для регулярного развертывания этих проектов в больших масштабах, когда это время придет.
Back-end проекты
Категория проектов генеративного ИИ с относительно низким уровнем риска – это чисто серверные приложения. Это приложения, не имеющие прямого выхода на аудиторию, даже в формате черновиков текстов. Они приносят пользу исключительно журналистам или бизнесу. Back-end проекты могут включать задачи, ориентированные на эффективность или качество, такие как маркировка, другие виды категоризации, предложения по созданию заголовков и SEO, сборку информационных бюллетеней из уже существующих копий, редактирование текстов, мозговой штурм и выработку идей, исследования, анализ и т. д.
Помимо относительно низкого риска, у серверных приложений ИИ есть ещё одно преимущество: их относительно легко внедрить, поскольку они зачастую слабо связаны с рабочим процессом и инфраструктурой производства новостей. Иногда такими приложениями можно управлять с помощью автономных инструментов, изолированных от основного издательского комплекса организации, под контролем специального персонала, отдельно от основного редакционного рабочего процесса.
Проекты языковых задач
Более амбициозная, но с относительно низким уровнем риска категория проектов генеративного ИИ включает себя приложения, которые создают черновой текст, изменяя исходный текст. Эти приложения используют языковые модели исключительно для «языковых задач» и не должны вносить в черновик какой-либо информационный контент, которого нет в исходном документе.
Эти приложения не зависят от знаний, доступных модели в результате ее обучения, и поэтому уменьшают (но не устраняют) риски ошибок, предубеждений и других проблем.
Примеры языковых задач включают обобщение, упрощение, стилистическую реверсию, переписывание текста для определенных каналов (социальные сети, тематические бюллетени и т. д.), написание сценариев для аудио или видео, перевод.
Языковые задачи могут выполняться с использованием любой формы доступа к модели, например, пользовательского интерфейса ChatGPT, специальных инструментов на основе API или даже в виде новых функций, интегрированных в системы создания и управления контентом. Языковые задачи также могут быть частью любой стратегии, включая стратегии, основанные на эффективности, новых продуктах или дифференциации. Это фундаментальная категория журналистских задач в редакции СМИ с поддержкой искусственного интеллекта.
Проекты задач знаний
К проектам генеративного ИИ с более высоким уровнем риска относятся приложения, создающие черновой текст с информационным содержанием, источником которого является сама языковая модель, а не исходный документ.
Эти приложения выполняют так называемые «задачи знаний» (или задачи по сбору знаний), поскольку они не просто модифицируют язык, но являются настоящими «авторскими» приложениями языковых моделей.
Повышенный риск, связанный с проектами задач знаний, обусловлен значительным потенциалом ошибок в обучающих данных, предвзятостью, устаревшим контекстом и другими ограничениями, присущими языковым моделям.
Тем не менее, если управлять этими рисками, то задачи по сбору знаний могут предложить значительный спектр новостных продуктов;
предоставление контекста для историй;
справочный контент;
различные интерпретации событий, основанные на историческом контексте;
и даже полные статьи, особенно на тему потребления тех или иных услуг и товаров.
Для снижения рисков, связанных с задачами по сбору знаний, требуются процессы редактирования, предназначенные для обнаружения ошибок и неподходящего контента. Это нетривиальные задачи, о чем свидетельствуют трудности, с которыми сталкивается CNET (веб-сайт, посвящённый компьютерным технологиям) при публикации контента, основанного на знаниях, источниками которых являются языковые модели.
Тем не менее, очевидно, что журналистам задачи, связанные с знаниями, открывают значительные возможности. Эти возможности, вероятно, будут расти по мере того, как мы (коллективно) узнаем больше о том, как управлять результатами таких приложений и редактировать их.
Как и в случае с языковыми задачами, задачи по изучению знаний можно по-разному интегрировать в рабочие процессы и использовать в разных стратегиях.
Трансформационные проекты «От посредника к посреднику»
Особенно амбициозной категорией генеративных проектов искусственного интеллекта для СМИ являются приложения, преобразующие информационный контент из одного информационного носителя в другой, например, из текста в аудио, из текста в видео или из текста в графические изображения.
В отличие от языковых задач и задач знаний, эти приложения обычно зависят от специальных моделей преобразования от посредника к посреднику, которые часто используются в сочетании с большими языковыми моделями общего назначения в сложных рабочих процессах.
К таким моделям специального назначения относятся модели преобразования речи в текст (транскрипция), модели преобразования текста в речь (синтетические голоса), модели преобразования текста в видео (синтетические аватары, автоматическое создание видеороликов B-roll и т. д.), модели преобразования текста в изображения и другие. Эти инструменты все еще находятся на ранней стадии. Но они очень быстро развиваются, широко доступны и во многих случаях уже соответствуют качеству аналогичных продуктов, которые создают люди.
Более того, потенциал этой категории приложений, вероятно, увеличится с неизбежным появлением так называемой «мультимодальной» функциональности, позволяющей осуществлять преобразования изображения в текст, видео в текст и другие преобразования.
Примеры журналистских задач, которые можно решить с помощью этих кросс-медийных моделей:
автоматическое или полуавтоматическое создание текстовых статей из аудио- или видеоисточников;
создание аудио- и видео- новостей из текстовых статей;
преобразование текстовых статей в графические истории или видеоролики;
автоматическое или полуавтоматическое создание подкастов на основе статей.
Эти возможности максимально полезны для стратегии расширения продукта. Такие задачи можно осуществлять, используя только пользовательские интерфейсы вендора (поставщика) модели, и поэтому они потенциально могут дать редакциям с относительно небольшими ресурсами возможность создавать мультимедийный контент в значительных масштабах.
На пути создания продуктов этой категории возможны следующие препятствия:
необходимость в продюсере редакционных материалов с опытом работы с устройствами вывода данных для обеспечения качества;
высокая стоимость использования специализированных моделей;
трудности с распространением одной и той же истории в нескольких различных средствах массовой информации.
Проекты, ориентированные на «прослушку» и мониторинг проектов
Все категории проектов, описанные выше, сосредоточены на новых способах создания новостных продуктов с использованием ИИ, но практические проекты, ориентированные на сбор новостей, также могут эффективно использовать большие языковые модели.
Сам термин «генеративный ИИ» указывает на создание медиа-контента, но большие языковые модели и мультимодальные модели также могут в самых широких масштабах читать, слушать, а вскоре – и наблюдать. Эти возможности открывают совершенно новые способы сбора и распространения новостей.
Типы задач по сбору новостей, которые могут выполнять эти модели, выходят далеко за рамки инструментов мониторинга предыдущего поколения – обычно они просто искали ключевые слова в лентах платформ социальных сетей. Способности LLM «понимать естественный язык» (NLU) позволяют не только читать, но и интерпретировать, оценивать, анализировать, синтезировать и обобщать.
Более того, они могут делать это не только с текстом и речью на естественном языке, но также и со структурированными данными, что наглядно демонстрирует новое дополнение к LLM GPT-4 от OpenAI – «интерпретатор кода» – и, вероятно, вскоре также с визуальной информацией в изображениях и видео.
Проекты, основанные на NLU и «масштабных репортажах», уже реализуются в редакциях агентств новостей, в том числе в небольших. Такие проекты могут больше всего подходить для стратегии дифференциации и позволяют редакциям создавать и поддерживать специальные возможности для систематического освещения конкретных областей.
Продвинутые проекты
Наше понимание потенциального применения ИИ в СМИ все еще находится в зачаточном состоянии – и не только из-за быстрого развития новых функций, но и потому, что мы только начали изучать потенциал этих инструментов для работы с новостями.
Описанные выше проекты легко осуществимы прямо сейчас, при уже существующей функциональности, но есть также несколько «ближайших границ» функциональности. Таким рубежом, в частности, является появление мультимодальной функциональности, которая уже доступна в ограниченных формах в Bing Chat, MidJourney и вскоре будет доступна в GPT-4. Вероятно, мультимодальная функциональность станет еще более мощной в приложениях, сочетающих языковую и визуальную информацию.
Второй ближайший рубеж – это появление «агентов» LLM, пионерами которых стали AutoGPT и BabyAGI. Эти подходы используют LLM для деконструкции задач высокого уровня, выраженных в расплывчатых терминах, на небольшие, конкретные, практические задачи, которые затем выполняют LLM. Они позволяют автоматизировать журналистские расследования.
Стратегии искусственного интеллекта и конкретные проекты искусственного интеллекта, описанные выше, показывают, что СМИ имеют реальные и конкретные возможности продвигаться к информационной экосистеме, основанной на искусственном интеллекте. Однако этих стратегий и проектов самих по себе недостаточно. Чтобы производить профессиональные новостные продукты с помощью рабочих процессов на основе ИИ в нужном масштабе, день за днем и месяц за месяцем, необходимо нечто большее. А именно, инфраструктура.
3. Инфраструктура редакции с поддержкой искусственного интеллекта
Старая инфраструктура искусственного интеллекта
За десять лет до появления больших языковых моделей инфраструктура для искусственного интеллекта в новостных организациях означала нечто иное, чем сегодня. Это были хранилища и пулы данных, хорошо структурированная и эффективно поддерживаемая схема метаданных, библиотеки вложений, команда по обработке данных, большой ежемесячный счет за услуги Amazon Web Service и дорожная карта продукта, ориентированная на обучение небольших специализированных моделей «машинного обучения» с нуля, с применением небольших объемов собственных данных.
Эта дорожная карта часто включала модели, ориентированные на бизнес, прогнозирующие, будут ли пользователи оплачивать подписку или уйдут; модели, ориентированные на журналистов, обеспечивающие множество специальных функций; и модели, ориентированные на аудиторию, включающие семантический поиск и, конечно же, различные виды рекомендательных систем.
Такая инфраструктура ИИ по-прежнему представляет ценность, даже если она доступна лишь небольшому числу элитных новостных агентств, но она сильно отличается от инфраструктуры, необходимой для применения генеративного ИИ.
Профессиональная работа с подсказками
Фундаментальным требованием для применения генеративного ИИ в работе с новостями является инфраструктура, позволяющая профессионально разрабатывать, тестировать и развертывать подсказки.
Модели искусственного интеллекта станут неотъемлемой частью будущего новостной журналистики, и контроль над этими моделями станет центральной функцией редакций.
Управление будет осуществляться с помощью подсказок (prompts). Будь то серверные задачи, языковые задачи или задачи знаний, и независимо от того, используются они в рамках стратегии эффективности, стратегии расширения продукта или стратегии дифференциации продукта – все приложения генеративного ИИ в новостных отделах фундаментально зависят не только от моделей, но и от подсказок, используемых для управления этими моделями.
Профессиональная работа с подсказками
Постоянное профессиональное владение подсказками не похоже на то, как журналисты случайно вставляют из дюжины вариантов из Google Doc один в ChatGPT, а выглядит как профессиональный конвейер «подсказок к публикации», который обеспечивает систематическое и контролируемое качество управления всеми аспектами подсказок, результатов, редактирования и развертывания.
Эти аспекты включают: оперативное проектирование, сборку, оценку и тестирование, «сертификацию», метаданные, хранение и извлечение, управление версиями, итеративное улучшение, отслеживание использования, аналитику, редактирование выходных данных, обучение и многое другое. Даже простое проектирование подсказок может включать в себя определение задач, применение системных ролей и «пользовательских инструкций», разработку небольших примеров, управление размером контекста, создание шаблонов подсказок, предоставление нескольких подсказок и многое другое.
Сама оценка результатов подсказок, примененных к стохастическим моделям, основанным на различных исходных документах, представляет собой сложную задачу комбинаторного редактирования, в отличие от всего, что ранее наблюдалось в работе с новостями. Все это требует инфраструктуры – баз данных, инструментов, пользовательских интерфейсов, схем, интеграции, процессов, аналитики, обучения и документации.
Интерфейсы между подсказками и журналистскими задачами
Если предположить, что адекватная инфраструктура подсказок имеется, редакции все равно потребуется интерфейс между этой инфраструктурой и журналистами.
Для многих журналистов это вряд ли будет «сырая» подсказка, которая, скорее всего, будет длинной, довольно сложной и, вероятно, «сертифицированной» как проверенная и надежная в соответствии с каким-то принятым процессом контроля качества. Вместо этого большинство журналистов, скорее всего, будут получать доступ к подсказкам с помощью кнопок и элементов управления, которые создают черновые результаты для редактирования и доработки.
Такая инфраструктура интерфейса может состоять из автономных журналистских инструментов с отдельными функциями для оперативного управления и оперативного использования. Подобное мы уже встречаем в интерфейсе нейросети для написания новостей Genesis от компании Google, в различных инструментах «новостного искусственного интеллекта» от стартапов и в ряде инструментов, разработанных редакциями новостей. Создание такой инфраструктуры также потребует комплексной интеграции в существующую инфраструктуру управления контентом организации или, возможно, даже совершенно новой формы CMS (системы управления контентом), разработанной специально для рабочих процессов ИИ.
Сохранение контроля над этими инструментами, кнопками и функциями, которые они предоставляют, а также подсказками, стоящими за этими кнопками, вероятно, будет иметь решающее значение для журналистской независимости в новостной экосистеме, опосредованной искусственным интеллектом.
Иллюстрация: Бета-интерфейс Newsroom AI с кнопками для журналистских задач, выполняемых большой языковой моделью.
Инфраструктура для персонализированного опыта
Даже при наличии последовательной стратегии, набора приложений, поддерживающих эту стратегию, и оперативного процесса управления, который делает выполнение этих приложений профессиональным, масштабы производства новостей с помощью ИИ по-прежнему будут ограничены доступной инфраструктурой управления, обслуживания и распространения контента.
Это особенно справедливо в отношении стратегии расширения продукта, реализуемой с использованием языковых задач или преобразований от посредника к посреднику.
Создать 5, 10 или 20 различных вариантов каждой истории, подходящих для самых разных аудиторий, ситуаций и контекстов потребления, может быть намного проще, чем фактически предоставлять каждый из этих вариантов нужному пользователю в нужное время. Это проблема персонализации, но она сильно отличается от обычной интерпретации «персонализации» в большинстве новостных редакций новостей.
Речь идет о персонализации истории, что потребует инфраструктуры, которая сможет хранить, выбирать и обслуживать разные варианты истории для разных пользователей или разных сегментов пользователей в разных ситуациях – в дополнение к рекомендации соответствующих историй.
Простая форма персонализации опыта, которую используют несколько редакций новостей, заключается в создании отдельного канала или даже совершенно отдельного бренда, с помощью которого можно будет предоставлять материалы редакции в новых форматах, генерируемых искусственным интеллектом.
Более продвинутая форма – предложить пользователю прямой контроль над своим опытом потребления, например, так, как это делает новостное приложение Artifact, которое предлагает потребление статей в виде резюме, упрощенного текста, историй с эмодзи, стихов или аудиозаписей знаменитостей.
Более сложная форма персонализации опыта — автоматическая адаптация опыта пользователя с использованием поведенческих данных и контекстных сигналов.
Каждый из этих подходов может открыть доступ к новостной журналистике для большего числа людей, но каждый из них также требует инфраструктуры, способной поддерживать управление и предоставление вариантов статей.
Инфраструктура сбора новостей
Инфраструктура также необходима для того, чтобы с помощью LLM существенно масштабировать сбор новостей путем мониторинга и анализа больших объемов исходных документов – возможно, в рамках стратегии дифференциации, ориентированной на конкурентоспособное освещение конкретной новостной области.
Отправной точкой является инфраструктура, обеспечивающая постоянный доступ к исходному материалу, который может существовать в различных текстовых форматах или в аудио- (видео-) форме, которую сначала необходимо обрабатывать с помощью ИИ-инструментов преобразования речи в текст или, возможно, даже в большие наборы данных. которые часто обновляются. Такая инфраструктура «мониторинга» может варьироваться от простого списка источников до сложного веб-сканера, который постоянно «считывает» части Интернета, чтобы поддерживать осведомленность о событиях в домене.
Мониторинг, который осуществляет такая инфраструктура, будет зависеть от системы подсказок и системы, которая управляет сводками и оценками, являющимися результатами таких подсказок.
Для всего этого требуются базы данных, схемы данных, инструменты доступа и функции фильтрации. Подобную функциональность можно создать в небольшом масштабе и использовать в качестве дополнения к рабочему процессу ручного мониторинга, и некоторые редакции уже делают это.
Гибкость инфраструктуры
Вполне возможно, что ИИ создаст совершенно новый интерфейс для журналистики, предоставляя новости, в основе которых не лежат отдельные текстовые, аудио- или видео-артефакты.
Мы видим первые признаки этого в виде интерфейсов чата, генеративного поиска и ранних диалоговых голосовых интерфейсов, реализованных на основе языковых моделей. Несмотря на данные исследований аудитории, указывающие на предпочтение пассивного, а не активного потребления новостей, все же возможно, что вскоре мы сможем взаимодействовать с новостями совершенно новыми способами.
Учитывая эту неопределенность, новостным организациям может быть полезно пересмотреть свою техническую архитектуру и инфраструктурную стратегию с точки зрения растущей потребности в гибкости. Это может быть попытка определить различные возможные сценарии продукта и путь к инфраструктуре, которая могла бы поддерживать эти сценарии, если они будут развиваться.
Любая такая переоценка должна учитывать множество новых вариантов архитектуры программного обеспечения с поддержкой ИИ и разработки этого ПО. Растущая потребность в гибкой инфраструктуре сопровождается появлением новых технологий с использованием искусственного интеллекта, которые могут упростить проектирование, создание и обслуживание такой инфраструктуры.
4. Организационная структура для команд, использующих ИИ
Новостным организациям придется работать по-другому
Новостная организация с последовательной, четко сформулированной стратегией реагирования на генеративный искусственный интеллект, предоставляемой через портфель хорошо продуманных приложений, поддерживаемых профессиональным процессом оперативного управления и доставляемых аудитории через персонализированный издательский стек, явно будет иметь все шансы интеграции в информационную среду, опосредованную искусственным интеллектом.
Но такой организации, вероятно, также придется работать иначе, чем традиционному издателю цифровых новостей, и ее организационная структура, вероятно, должна будет существенно измениться, чтобы поддержать эти различия. Более того, навыки и таланты, необходимые для успешной работы в этой среде, вероятно, также будут разными.
В центре дискуссий о вероятных изменениях в структуре новостных организаций часто стоит потенциал ИИ, который может заменить или расширить традиционные рабочие места. Но реальность, вероятно, окажется более сложной.
Совершенно очевидно, что многие задачи отдела новостей станет выполнять ИИ, но также несомненно и то, что появится много новых задач. Очевидно, что на данном этапе сложно предсказать, как старые и новые задачи будут объединены в отдельные должности, команды и функции на уровне отдела. Разные редакции с разными стратегиями явно будут делать это по-разному. Тем не менее, мы можем высказать некоторые обоснованные предположения, используя в качестве отправной точки вероятные движущие силы организационных изменений.
Движущие силы организационных изменений
Рассматривая, на что способен генеративный ИИ, как он используется для новостных приложений и как о нем говорят новостные СМИ, можно сделать некоторые предположения о том, как искусственный интеллект изменит СМИ:
Вполне вероятно, что технологии будут играть более важную роль в новостных СМИ, чем сейчас. Вероятно (хотя это и менее очевидно), что доступность генеративного ИИ приведет к тому, что использование технологий и контроль над ними будут рассредоточены по всей организации, а не сконцентрированы внутри команды специалистов.
Вполне вероятно, что новостные организации будут уделять больше внимания адаптивности и постоянным бизнес-инновациям.
Вполне вероятно, что могут появиться существенные различия в продуктивности команд и отдельных лиц, вызванные разной эффективностью использования ИИ.
Вполне вероятно, что по мере усиления конкуренции за внимание аудитории новостные СМИ будут все больше ценить глубокое понимание своей аудитории и ее информационных потребностей.
Вполне вероятно, что новостные СМИ будут меньше фокусироваться на создании отдельных материалов вручную, а больше на наблюдении за системами и процессами, которые создают или помогают создавать новости (по крайней мере, некоторые категорий новостей).
Все эти изменения можно суммировать одним словом: автономия. Те команды, которые внедрят и освоят ИИ, смогут делать гораздо больше, и при этом меньше зависеть от своих коллег в других отделах редакции.
Подразделения новостных СМИ, основанных на ИИ, могут быть небольшими, многопрофильными и самоуправляемыми командами, работающими относительно независимо друг от друга. Каждая будет сосредоточена на обслуживании определенной аудитории или потребности аудитории.
В рамках такого сценария новостное агентство становится своего рода федеративной средой, в которой самоуправляющиеся команды могут выдавать продукт, но не руководить своей работой.
Такая федеральная организация обеспечивает бренд, ценности, сертификацию качества, монетизацию, финансовую стабильность, инфраструктуру, обучение и общую стратегию. Отдельные команды обеспечивают адаптивность, быстрое принятие решений, осведомленность об аудитории и конкурентах и, конечно же, рутинное производство ценного контента с помощью рабочих процессов, дополненных искусственным интеллектом.
Какое будущее ждет новостную журналистику?
Развитие генеративного искусственного интеллекта поставило журналистику на порог значительных перемен, которые можно сравнить с моментом появления iPhone, рождением Интернета и даже появлением печатного станка.
Значимость момента осознало и оценило высшее руководство большинства новостных редакций, и многие из них уже идут вперед к конкретным инициативам и экспериментам, направленным на подготовку к будущему, основанному на искусственном интеллекте.
Значительное внимание уделяется потенциальному вреду, этике использования ИИ в журналистике, влиянию ИИ на регулирование и законодательство, возможности дезинформации со стороны ИИ, обучению аудитории и «грамотности ИИ», а также выпуску рекомендаций, которые помогут новостным СМИ начать трансформацию своей отрасли.
Это внимание важно и представляет ценность, но его недостаточно. Журналистам необходимо использовать новые инструменты, изучить их потенциал, а также научиться прагматично их применять. Соответствующих учебников пока нет, есть только практика и обучение. Осторожность желательна, но ждать полной ясности не стоит.
Необходимость практического знакомства с прикладным искусственным интеллектом в журналистике становится все более очевидной, поскольку высока вероятность того, что вся информационная экосистема, в которой существует современная журналистика, подвергнется трансформации.
Как будет выглядеть, например, журналистика в среде, где текст, аудио и видео изменчивы и податливы к предпочтениям каждого отдельного потребителя? Какой должна быть продукция СМИ в среде, где эту продукцию потребляют в основном машины? Как в такой среде будет сохраняться последовательная запись новостей – архивный «первый набросок истории»? Как редакции смогут получать выгоду от работы в такой среде? Что это будет за работа?
Эти, как и другие, столь же фундаментальные, вопросы могут не стать актуальными в течение многих лет или даже десятилетий, но просто участие в этой дискуссии потребует от ньюсмейкеров реального опыта в журналистике, дополненной искусственным интеллектом.
В этой статье я попытался описать способы, которыми новостные СМИ могли бы использовать ИИ с помощью конкретных стратегий, проектов, инфраструктуры и организационных изменений.
Эти предложения представляют собой мою собственную интерпретацию того, что я вижу в этой сфере, и ни в коем случае не являются исчерпывающими или полными. Было бы естественно ожидать, что люди, стоящие во главе новостных СМИ, будут демонстрировать разочарование или даже негодование в связи с перспективой надвигающихся перемен, но я наблюдал совсем другое.
Преобладающим настроением наших дискуссий об ИИ были оптимизм и воодушевление в связи с возможностями ИИ на пути к дальнейшей реализации задач журналистики.