Как открытые данные помогут победить коронавирус
Антибіотико-резистентна бактерія. Фото: Dr Kateryna/Fotolia

Вже багато тижнів моя стрічка Facebook переповнена таблицями, графіками та мапами розповсюдження коронавірусу. Фахівці з аналізу і візуалізації даних таким чином інформують людей щодо загроз, темпів поширення епідемії та методів захисту. Але це не єдине, що можна зробити з даними. В майбутньому дата-саєнтисти будуть глибоко залучені у боротьбу з новими пандеміями, а в кращому випадку допоможуть їм запобігти. 

COVID-19 — не остання епідемія

Здається, нові спалахи невідомих вірусних інфекцій на нас таки чекають. Американський вірусолог Суреш Кучипуді зауважує, що активна урбанізація східних і африканських країн знищує цілі екосистеми. Дикі тварини переміщуються ближче до людських поселень, контактують зі свійськими тваринами та напряму з людьми, передаючи нам свої віруси. Саме так з’явились коронавірусні інфекції SARS (Severe Acute Respiratory Syndrome) 2003 року та MERS (Middle East Respiratory Syndrome), спалахи якого відбулись у 2012, 2015 та 2018 роках. 

Експертка з глобальних систем охорони здоров’я Аланна Шейх у своєму виступі на TEDxSMU у Техасі зазначає, що в майбутньому на людство чекають нові спалахи коронавірусних інфекцій. Системи охорони здоров’я багатьох держав не готові до подібних спалахів. У країнах, що розвиваються, смертність може бути в рази вищою, ніж в США чи Японії. Аланна бачить вихід у розбудові глобальної системи, яка допоможе вчасно виявляти нові спалахи по всьому світу, щоб захворювання не поширювались. 

Відкриті дані проти антибіотикорезистентності

Один з прикладів, на які варто звернути увагу, — проєкт Open Data Institute Antimicrobial Resistance (AMR) Surveillance Data. Його назву можна приблизно перекласти як «Дані спостережень резистентності до антибіотиків, противірусних і протигрибкових препаратів». 

ВООЗ пов’язує з AMR 700 тисяч смертей на рік. ООН говорить, що понад 200 тисяч немовлят помирають щороку через інфекції, які не піддаються наявним лікам. Це глобальна проблема, яку не може вирішити самостійно жоден лікар чи науковець. Проаналізувавши великі вибірки якісних даних, медики зможуть краще обирати препарати для лікування конкретних захворювань, точно визначати дозування і тривалість курсу, а фармкомпанії швидше розроблятимуть нові ліки.

Фахівці з ODI побудували платформу для збирання і зберігання структурованих даних про антибіотикорезистентність. Вони опитали 12 великих фармкомпаній, додали на портал дані про 12 програм дослідження AMR та зібрали інформацію про 85 препаратів з 93 країн.

Как открытые данные помогут победить коронавирус
Етапи розробки вакцини

Серед учасників ініціативи була відома фармацевтична компанія GlaxoSmithKline (GSK). ЇЇ Head of Data Science and Clinical Systems Дуччо Медіні зазначає, що фарміндустрія — одна з найбільш регульованих, і це уповільнює інновації. Він закликає працювати над середовищем, яке допоможе ефективніше співпрацювати людям з різною експертизою: в хімії, епідеміології, статистиці, проектуванні. Дані — єдина спільна мова для цих спеціалістів, говорить Медіні. 

Ми поки що не бачимо результатів у вигляді нових препаратів на ринку. Проте це в принципі дуже повільний процес. Міжнародна неприбуткова організація RAND зазначає, що нові класи антибіотиків не з’являються на ринку вже понад 25 років. Global Antibiotic Research and Development Partnership (GARDP) ставить собі за мету винайти п’ять принципово нових ліків до 2025 року — і вказує, що на це потрібно півмільярда євро. Робота з даними — один зі способів прискорити цей процес і зробити його хоч трохи дешевшим.

Як дані допомагають створювати ліки

Близько 10 років тому в межах World Wide Web Consortium (W3C) діяла оперативна група LODD — Linked Open Drug Data. Фахівці спробували зібрати всі доступні на той момент дані про ліки та пов’язати їх між собою, щоб знайти відповіді на фундаментальні і прикладні питання. У базі наукових матеріалів Google Scholar можна знайти немало робіт, пов’язаних з цією ініціативою. Самі автори опублікували статтю про значення LODD для фармацевтичних досліджень та розробок — її варто прочитати, якщо ви хочете працювати з медичними даними.

Одна з робіт, на які звертає увагу медична робоча група W3C, досліджує схожість побічних ефектів різних ліків. Зазвичай спеціалісти розуміють ціль препарату, виходячи з його молекулярних чи клітинних особливостей. Автори цієї роботи припустили, що спільна лікувальна дія може існувати у препаратів зі схожими побічними ефектами. Проаналізувавши сотні ліків, вони знайшли потенційні зв’язки між хімічно різними препаратами. Після тестування 13 зв’язків підтвердились, 9 з них успішно випробували на живих клітинах. Ці дев’ять препаратів можуть виявитись корисними для лікування інших хвороб — не тих, для яких їх винайшли і зареєстрували. Це не значить, що медики повинні призначати ліки за таким принципом. Це значить, що дата-саєнтисти здатні допомогти у пошуку інсайтів, які вчені і лікарі потім підтвердять чи спростують. 

Зараз в ЗМІ з’являється інформація про використання певних ліків проти COVID-19 — зокрема, препаратів від ВІЛ та малярії. У таких ситуаціях, коли медики намагаються хоч якось допомогти людям з важкими симптомами, чисті машиночитні дані та інструменти для їх аналізу можуть принести велику користь.

Как открытые данные помогут победить коронавирус
TripleMap - веб-додаток, що надає зручний інтерфейс до датасету LODD

AMR Project і LODD — найбільш помітні приклади використання даних у медицині та фармацевтиці. Насправді таких прикладів більше. Є і приватні компанії, які займаються аналізом даних для фарміндустрії. Їх ставатиме більше, адже це дозволяє знизити витрати на розробку ліків. У 2014 році авторитетний науковий журнал Chemical & Engineering News писав, що середня вартість розробки нового препарату перевищила 2,5 млрд доларів. В цій сумі враховані доклінічні і клінічні випробування. Додайте сюди виготовлення партій на продаж, логістику, маркетинг, прибуток виробників та інвесторів. При таких витратах сучасні ліки і вакцини не можуть коштувати дешево. Ми платимо за ці розробки — напряму зі своїх кишень або податками, якщо препарати закуповує держава. І ми зацікавлені в тому, щоб зробити процес пошуку ліків швидшим і дешевшим. І якраз на це здатні технології.

Як саме дані можуть допомогти медикам

ODI зазначає, що релевантні дані можуть бути корисними в тому, щоб зрозуміти, за яких умов вірус прогресує, розробити рекомендації з гігієни, допомогти у подоланні наслідків соціальної ізоляції та економічної кризи. Організація запустила хештег #DATA4COVID19, який має поширити ідею відкриття даних, так чи інакше пов’язаних з пандемією.

За ініціативи Білого дому було опубліковано датасет з 30 000 наукових публікацій про SARS-CoV-2 та коронавіруси. Уряд США закликає дата-саєнтістів спробувати видобути з цього масиву інсайти, які допоможуть вченим та медикам ефективніше боротися з COVID-19.

Аналізуючи великі масиви даних про здоров’я людей, медицину і фармацевтику, можна знаходити багато обґрунтованих рішень — від потенційно корисних комбінацій діючих речовин у ліках до прогнозів, де спалахне наступна епідемія. При цьому використовуються неперсоналізовані дані, тож це можна робити, не загрожуючи правам і свободам людей.

Дані також можна брати з інших галузей, не пов’язаних прямо з охороною здоров’я. Наприклад, в Journal of Open Health Data є датасет з прогнозом щільності населення на 2030 і 2050 рік. Самі автори пропонують використовувати ці дані, щоб визначати зокрема і потенційні місця нових спалахів хвороб. 

Стимулює об’єднуватись навколо боротьби з епідемією і те, що коронавірус впливає на всі індустрії, а не лише на медицину. Наприклад, СЕО польської компанії Talent Alpha Пшемек Берендт зібрав майндмеп, де позначено, які вертикалі бізнесу зараз стикаються з проблемами, а які можуть зробити великий стрибок у розвитку. Перші зацікавлені збирати дані про пандемію, щоб втриматися на плаву і скоріше вийти з кризи. Другим потрібно розуміти, які саме проблеми з’явились у їхньої цільової аудиторії, як їх краще вирішити та які додаткові ресурси для цього потрібні.

Що можете зробити особисто ви

Отже, дата-саєнтисти і open data комьюніті всіх врятують? Звісно ні. Але ми можемо допомогти у розбудові інфраструктури для обробки медичних даних. Ми можемо боротись за відкриття даних, ділитись досвідом з їх збирання, зберігання та аналізу. 

В Україні ситуація з відкритими даними у цій галузі складна. Якщо зайти на Єдиний державний портал відкритих даних, у розділі «Охорона здоров’я» бачимо один набір, і його розпорядник — Міністерство юстиції. Для порівняння: на британському порталі знаходимо 1807 наборів у розділі Health, на американському — окреме посилання на HealthData.gov з 4349 наборами. 

Перед оновленнями Постанови Уряду №835, яка регулює роботу з open data в Україні, завжди відбуваються обговорення для експертів та громадськості. МОЗ брав участь у деяких розглядах, але поки міністерство ще не надало тих наборів даних, що передбачає Постанова. Сподіваємось, що з появою Міністерства цифрової трансформації нам стане простіше знайти точки перетину і налагодити спільну роботу в цьому напрямку. 

Корисною може стати будь-яка робота, пов’язана з відкритими даними. Сервіси, які використовуються для пошуку ефективних рішень у бізнесі, можна адаптувати для наукових задач. Серед фіналістів національного конкурсу стартапів на основі відкритих даних Open Data Challenge є цікавий кейс. Одна з команд винайшла сервіс, що виявляє корупційні зв’язки в українському політикумі, а потім пристовувала його ще й для визначення шахрайських схем і зараз продає фінансовим компаніям з усього світу. 

Якщо ви лише починаєте працювати з даними, відвідуйте івенти, навчайтесь, запускайте стартапи і приходьте на інкубаційні програми. Ми продовжили до 5 квітня прийом заявок на Open Data Challenge. На конкурс за попередні три роки подавалось небагато медичних проєктів, проте серед наших фіналістів є ДонорUA, який допоміг врятувати безліч людей, знайшовши для них донорів крові. Багато проєктів можуть бути адаптовані до медичних потреб. Тож якщо маєте ідею, скористайтесь цією можливістю.

Якщо ви працюєте у публічному адмініструванні і маєте ідеї щодо використання технологій у боротьбі з епідеміями, можна спробувати свої сили в EU Association Lab. Ми приймаємо заявки від працівників міністерств та інших органів державного управління, котрі розробляють євроінтеграційні стартапи. 

Якщо ви вже маєте експертизу в роботі з даними, розповідайте про свою діяльність. Виступайте на івентах, менторіть стартапи в інкубаційних програмах, пишіть колонки, ведіть соцмережі, розповідайте про наші можливості і плани людям з інших галузей. Якщо ви взагалі не маєте відношення до роботи з даними, спробуйте розібратись, як це працює і чим може бути корисним у вашій діяльності. Давайте будувати міжгалузеві зв’язки. Ми, люди, потрібні одне одному. І карантин про це дуже добре нагадує.

Исполнительный директор 1991 Open Data Incubator Евгения Клепа, специально для Liga.Tech