17 жовтня 2019 р. 12:25

Як штучний інтелект виявляє російську пропаганду в українських медіа

Як штучний інтелект виявляє російську пропаганду в українських медіа

Національний демократичний інститут з міжнародних відносин (NDI) спільно з ГО «Агенція журналістики даних» (видання Texty.org.ua) публічно презентували розроблений ними інноваційний інструмент, який уже протягом чотирьох місяців моніторить теми російської та проросійської пропаганди в українському медіапросторі, зокрема – на сайтах окупаційної влади й ОРДЛО.

Національний демократичний інститут з міжнародних відносин (NDI) спільно з ГО «Агенція журналістики даних» (видання Texty.org.ua) публічно презентували розроблений ними інноваційний інструмент, який уже протягом чотирьох місяців моніторить теми російської та проросійської пропаганди в українському медіапросторі, зокрема – на сайтах окупаційної влади й ОРДЛО.

З проєктом «Свіжа деза з Росії» можна ознайомитися на сайті Texty.org.ua. Фактично це регулярно оновлювана візуалізована база даних. Починаючи з травня 2019 року аналітики опублікували вже 11 тижневих моніторингів, які свідчать про цілеспрямоване поширення російських наративів та мініпулятивного контенту.

Під час презентації учасники проєкту розповіли, як працює новий інструмент, навели приклади поширених тез російської пропаганди та пояснили, як ці меседжі заходять в український інформаційний простір.

Хто поширює російську дезінформацію в Україні

Головний редактор Texty.org.ua і виконавчий директор ГО «Агенція журналістики даних» Роман Кульчинський перерахував основні категорії та джерела поширення російської дезінформації в Україні. За його словами, така пропаганда поширюється із сотень і навіть тисяч джерел. Меседжі можуть бути дуже різними, але всі вони мають однакове спрямування.

«Коли російського агента хотіли отруїти в Британії, поширювалося кілька російських меседжів. Одні писали, що отрута нібито прийшла з Чехії, інші — що зі Швеції. Росія часто поширює тези, які між собою є дуже суперечливими. Але вони мають одну мету — привести думку аудиторії до того, що Росія до цього нібито не причетна. Чому вони так працюють? Відомо, що коли ви десять разів почули брехню і один раз — правду, то скоріше запам’ятаєте брехню. Навіть якщо абсолютно перевірене джерело на кшталт BBC поширило одну вірну тезу, але лише раз, а так звані "зливні бачки" поширили неправду багато разів, то людина радше запам’ятає друге», — каже він.

В Україні російська дезінформація працює кількома «колонами», зауважує пан Кульчинський. Перша — це проросійські ЗМІ, які нібито дотримуються журналістських стандартів. Як приклад таких ЗМІ в Україні він навів телеканали NewsOne, «112 Україна», сайт «Страна.ua», газету «Вести».

Інша «колона» — це «сміттєві бачки». Їх в Україні до двох сотень таких сайтів, вони мають величезну щомісячну аудиторію: близько 50 мільйонів відвідувань на місяць. «Приміром, сайт поважного видання "Ліга" має 5 мільйонів відвідувань на місяць. А так звані "сміттєві бачки"— це середовище, де все купується і все продається. Туди заходить все: і російське, й українське. Сайти вирізняють клікабельні емоційні заголовки для привернення уваги», — зауважує пан Кульчинський.

Третя «колона» — це пабліки та персоналії в соціальних мережах, які «Facebook нещодавно потроху почав чистити». Пан Кульчинський має на увазі випадок, коли Facebook забанила сторінки клікбейтних сайтів Znaj, Politeka та інших. Загалом адміністрація соцмережі видалила 149 подібних сторінок.

«Криза», «зубожіння», «все погано»

Щоб дослідити поширення російського дезінформаційного контенту, аналітики Texty.org.ua вирішили сконцентруватися на так званих «сміттєвих бачках».

«Ми навчили машинний алгоритм виявляти емоційно забарвлені новини. Якщо низка ЗМІ, навіть просросійські, не використовують яскраве емоційне забарвлення й маніпуляцію там виявити важко, то на таких сайтах як Znaj, Politeka пишуть новини емоційно й навіть без натяку на стандарти», — розповідає Роман Кульчинський.

Найчастіші тези, які поширюються з Росії, — дискредитація керівництва держави, меседжі на кшталт «Україна — недодержава», «держава — помилка 404», «в Україні все погано і буде ще гірше», «в Україні — криза, економічне зубожіння».

Часто на погані новини перетворюють навіть абсолютно позитивні, а тим паче нейтральні повідомлення: «Наприклад, кілька років тому багато хто читав про те, як з Херсона до Києва Дніпром пливла баржа з кавунами. Позитивна літня новина, навіть стала мемом. Як не дивно, до цього приєдналася група російських тролів, які стали це перевертати і писати "у нас северный флот, а у них — баржа", "американцы смогли профинансировать только одну баржу" тощо».

Пропагандисти часто розповідають і те, що «Порошенко сяде в тюрму, Кличко втече з Києва».Недавно «Детектор медіа» вже розвінчував одну з таких маніпуляцій, коли немало українських ЗМІ написали, що «Порошенко та Кличко втекли з Києва».

«Пропагандистські ЗМІ буквально з маніакальною наполегливістю пишуть, що українські війська нібито обстрілюють мирне населення. Я якось спілкувався із жінкою з Донбасу, яка казала: "У вас і зарплати вищі, і сир смачніший, але все одно ЗСУ обстрілює мирних мешканців"», — згадує редактор.

Редакція Texty.org.ua також помітила, що така російська пропаганда активно підтримує партію «Опозиційна платформа – За життя» та одного з її лідерів, кума Володимира Путіна Віктора Медведчука. «Щодо Володимира Зеленського, то його вони критикують, але з різним рівнем інтенсивності. Буває й таке, що називають його "кривавим клоуном"», — додає пан Кульчинський.

Двері у світ «сміттєвих бачків»

Інструмент, який моніторить теми російської та проросійської пропаганди в українському медіапросторі, — це найскладніший проект, над яким працювала команда Texty.org.ua. Частина проекту «Свіжа деза з Росії» заснована на одному з попередніх проектів — «У нас погані новини». У ньому аналітики дослідили діяльність сайтів-клікбейтів.

«Рік тому ми почали вивчати, що собою становить система цих "сміттєвих" сайтів. Ми провели десятки експериментів. Одне із завдань полягало в тому, щоб зробити інструмент, який якимось чином відсікав би маніпулятивні новини. І вийшло так, що першим дослідженням ми відкрили двері у цей "чарівний" світ "сміттєвих" сайтів. Зараз ми зробили вже другий проект, і відстежувати поширення дезінформації тепер можна на практиці», — зауважив керівник напрямку журналістики даних Texty.org.ua Анатолій Бондаренко.

Проект «Свіжа деза з Росії» не можна вважати повністю завершеним, бо пропаганда змінюється, навіть мова частково змінюється. «І коли через рік після вивчення "сміттєвих бачків" настали реалії передвиборчої України, то ми переконалися, що й контекст пропаганди змінюється. Через певний період треба буде вдосконалювати алгоритм, щоб він міг виявляти й інші аспекти пропаганди. У проєкту немає стовідсоткової точності. Але станом на сьогодні це найкраще з того, що в нас існує», — додав пан Бондаренко.

Як працює інструмент на основі штучного інтелекту?

Редакція Texty.org.ua пояснює, що збирає новини з вибірки українських сайтів, у якій переважають так звані «зливні бачки». Дані завантажують з RSS стрічок сайтів або з посилань на їх сторінках у Facebook. Для кожної новини завантажують дату публікації, лінк, заголовок і повний текст.

Далі визначають мову для кожного тексту та відбирають лише ті, які написані російською мовою. Вибір мови обумовлений тим, що більшість дезінформації російськомовна. Кожен текст готують до аналізу: розділяють на одиниці мови — слова й розділові знаки, приводять слова до інфінітивної форми та складають словник слів у масиві даних новин. З усіх новин відкидають новини не про суспільно-політичне життя в Україні: спорт, погоду, зіркове життя, іноземні новини (таких матеріалів близько половини).

Кожну новину оцінює покращена версія класифікатора маніпулятивних новин: алгоритм додатково «тренували» на нових даних задля підвищення точності. Він передбачає ймовірність того, що новина містить емоційні маніпуляції та/або хибну аргументацію.

На новинах зі «зливних бачків», сайтів з окупованих територій та видань з антиукраїнською позицією класифікатор знаходить 62% матеріалів, які містять хоча б один вид маніпуляції, при цьому хибно маркує як маніпулятивні 6% матеріалів. Тобто алгоритм радше пропускає маніпуляцію, ніж знаходить її там, де маніпуляцій немає. Для дослідження тем вибирають лише маніпулятивні новини російською мовою із сайтів, на яких класифікатор виявляє понад 10% маніпулятивних новин від загальної кількості матеріалів про суспільно-політичне життя в Україні.

Журналістка даних Texty.org.ua Надія Романенко безпосередньо працювала над практичними аспектами інструменту. Вона перерахувала тези пропаганди, які або не змінювали інтенсивність, або навпаки активізовувалися у певний період.

«Ми побачили, що в темі війни відзначається стабільність з періодичними піками. Наприклад, такий пік спостерігався під час обміну полоненими між Україною та Росією. Радує те, що в українських новинах зараз практично немає маніпуляцій на темі війни. Коли на графіку все ж є коливання, то це скоріше за все "джинса" Медведчука, де він наголошував на своїй ролі в обміні полонених. Також ми знайшли стабільність у висвітленні теми Криму, життя на окупованих територіях та в діяльності президента України», — пояснила аналітикиня.

Інструмент для дослідників і журналістів

Національний демократичний інститут з міжнародних відносин (NDI) упродовж кількох років аналізує, як суспільства різних країн реагують на російську пропаганду та пропонує ефективні методи боротьби з нею.  «Також нам треба знати, чому ця дезінформація поширюється, які її цілі. Бо якщо ми не знаємо цього, то опиняємося під ризиком, коли наші місцеві медіа підсилюють її. Інноваційний інструмент, розроблений фахівцями Texty, допоможе стежити за динамікою та інтенсивністю поширення російської пропаганди та побачити, як тези поширюються через так звані "сміттєві бачки", сайти-клікбейти», — зазначила представниця NDI Тамта Отіашвілі.

Представники NDI і Texty.org.ua закликали всіх зацікавлених користуватися цим інструментом.

Наприклад, з його допомогою можна перевірити гіпотези про поширення тієї чи іншої пропагандистської тези, перевірити динаміку її поширення та подивитися, що писали в певні дати ЗМІ, які вас цікавлять. «Можливо, дешборд (інтерактивна панель з аналітичними даними. – ДМ) не буде цікавим з першого погляду. Але він стане цікавим тоді, коли почати клікати, перевіряти і спробувати дослідити це самому», — додала Надія Романенко.

Поділитися