В последние годы использование алгоритмов для автоматической генерации новостей из структурированных данных потрясло индустрию журналистики – особенно после того, как Associated Press, одна из самых крупных и наиболее устойчивых новостных организаций, стала автоматизировать производство ежеквартальных отчетов о корпоративных доходах.
Алгоритмы могут не только создавать тысячи новостных историй на определенную тему, но и делать это быстрее, дешевле и потенциально с меньшим количеством ошибок, чем любой журналист — человек.
Неудивительно, что это новшество стало питать страхи журналистов о том, что производство автоматизированного контента в конечном итоге лишит новостные редакции работы, хотя в то же время исследователи и практики видят потенциал технологии в улучшении качества новостей.
Руководство международного аналитического медиацентра TowCenter подытоживает недавние исследования по этой теме и дает обзор текущего состояния «автоматизированной журналистики», обсуждает ключевые вопросы и потенциальные последствия ее использования и предлагает возможности для будущих исследований. Весь отчет на английском языке можно найти здесь.
Это – перевод ключевых моментов доклада.
Состояние рынка
* Компании по всему миру разрабатывают программные решения для генерирования автоматизированных новостей.
* Ведущие медийные компании, такие как Associated Press, Forbes, The New York Times, Los Angeles Times и ProPublica начали автоматизировать свой новостной контент.
* Ключевые факторы для развития автоматизированной журналистики – это все возрастающая доступность структурированных данных, а также нацеленность новостных организаций на снижение расходов и увеличение количества новостей.
Потенциал
* Алгоритмы способны генерировать новости быстрее, масштабнее и в потенциале с меньшим количеством ошибок, чем журналисты-люди.
* Алгоритмы могут использовать одни и те же данные для подготовки сюжетов на множестве разных языков и с разных точек зрения, таким образом персонализируя новости под индивидуальные предпочтения читателя.
* Алгоритмы имеют потенциал генерирования новостей по требованию в ответ на вопросы пользователя о информации.
Ограничения
* Алгоритмы полагаются на данные и предпосылки, которые подвержены субъективным предубеждениям и ошибкам. В результате алгоритмы могут выдавать результаты неожиданные, непреднамеренные и содержать ошибки.
* Алгоритмы не умеют задавать вопросы, объяснять новые феномены или устанавливать причины и, таким образом, ограничены в своей способности наблюдать за обществом и выполнять журналистские задачи, такие как придание направления и формирование общественного мнения.
* Качество письма автоматизированных новостей ниже, чем у человека, но вероятно, улучшится, особенно с развитием технологии генерации текстов на естественных языках.
Ключевые вопросы и следствия
Для журналистов
* Люди и автоматизированная журналистика будут, вероятно, тесно интегрированы и сформируют «союз человек-машина».
* Журналистам советуется развивать умения, которые не могут повторить алгоритмы, такие как глубокий анализ, интервьюирование, исследовательская журналистика.
* Автоматизированная журналистика, вероятно, заменит собой журналистов, которые всего лишь «покрывают» рутинные темы, но также она создаст и новые рабочие места в рамках развития алгоритмов, генерирующих новости.
Для потребителей новостей
* Люди относятся к автоматическим новостям как к более заслуживающим доверия, чем новости, написанные людьми, но им не особенно нравится читать автоматизированный контент.
* Автоматизированные новости в настоящее время наиболее подходят для тематик, в которых выдача фактов быстро и эффективно является более важной задачей, чем усложненный рассказ, или где новость не существовала ранее и потребители таким образом имеют низкие ожидания к качеству письма.
* О требованиях читателей к прозрачности алгоритмов, то есть нужно ли (или хотят ли) они понимать, как работают алгоритмы, известно мало.
Для новостных организаций
* Поскольку алгоритмы не могут быть ответственны за ошибки, ответственность за автоматизированный контент будет лежать на человеке (например, журналисте или издателе).
* Прозрачность алгоритмов и подотчетность станут критически важными, когда случается ошибка, в особенности при описании противоречивых тем и/или персонализации новостей.
* Кроме базовых рекомендаций, которым должна следовать новостная организация при автоматической генерации новостей, о том, какая информация должна стать прозрачной в отношении того, как работают алгоритмы, известно мало.
Для общества
* Автоматизированная журналистика существенно увеличит объем доступных новостей, что еще больше увеличит бремя читателей по нахождению контента, который им наиболее нужен.
* Развитие автоматизированных – и в частности, персонализированных – новостей, вероятно, вновь оживит тревоги о потенциальной фрагментированности общественного мнения.
* О потенциальных последствиях для демократии, если алгоритмы возьмут на себя роль журналистики как сторожевого пса для правительства, известно мало.