Овогодинешната награда „Ласкер“ за основни медицински истражувања им беше доделена на Демис Хасабис и Џон Џампер за нивниот придонес во создавањето на системот за вештачка интелигенција AlphaFold кој ја предвидува тродимензионалната структура на протеините врз основа на секвенцата од прв ред на аминокиселини.
Нивните резултати решаваат проблем што долго време ја мачи научната заедница и отвораат врата за забрзување на истражувањата низ биомедицинската област. Протеините играат клучна улога во развојот на болести: кај Алцхајмеровата болест, тие се преклопуваат и се групираат; кај ракот, нивната регулаторна функција е изгубена; кај вродените метаболички нарушувања, тие се нефункционални; кај цистичната фиброза, тие одат во погрешен простор во клетката. Ова се само неколку од многуте механизми што предизвикуваат болести. Деталните модели на протеинската структура можат да обезбедат атомски конфигурации, да го поттикнат дизајнот или изборот на молекули со висок афинитет и да го забрзаат откривањето лекови.
Протеинските структури генерално се одредуваат со рендгенска кристалографија, нуклеарна магнетна резонанца и криоелектронска микроскопија. Овие методи се скапи и одземаат многу време. Ова резултира со постоечки бази на податоци за 3D протеински структури со само околу 200.000 структурни податоци, додека технологијата за секвенционирање на ДНК произведе повеќе од 8 милиони протеински секвенци. Во 1960-тите, Анфинсен и сор. открија дека 1D секвенцата на аминокиселините може спонтано и повторливо да се преклопи во функционална тридимензионална конформација (Слика 1А) и дека молекуларните „шаперони“ можат да го забрзаат и олеснат овој процес. Овие набљудувања доведоа до 60-годишен предизвик во молекуларната биологија: предвидување на 3D структурата на протеините од 1D секвенцата на аминокиселините. Со успехот на Проектот за човечки геном, нашата способност да добиеме 1D аминокиселински секвенци значително се подобри, а овој предизвик стана уште поитен.
Предвидувањето на протеинските структури е тешко од неколку причини. Прво, сите можни тридимензионални позиции на секој атом во секоја аминокиселина бараат многу истражување. Второ, протеините максимално ја користат комплементарноста во нивната хемиска структура за ефикасно конфигурирање на атомите. Бидејќи протеините обично имаат стотици „донори“ на водородни врски (обично кислород) кои треба да бидат блиску до „акцепторот“ на водородната врска (обично азот врзан за водород), може да биде многу тешко да се пронајдат конформации каде што скоро секој донатор е блиску до акцепторот. Трето, постојат ограничени примери за обука на експериментални методи, па затоа е потребно да се разберат потенцијалните тридимензионални интеракции помеѓу аминокиселините врз основа на 1D секвенци користејќи информации за еволуцијата на релевантните протеини.
Физиката првпат беше употребена за моделирање на интеракцијата на атомите во потрагата по најдобра конформација, а беше развиен и метод за предвидување на структурата на протеините. Карплус, Левит и Варшел ја добија Нобеловата награда за хемија во 2013 година за нивната работа на компјутерска симулација на протеини. Сепак, методите базирани на физика се компјутерски скапи и бараат приближна обработка, па затоа не можат да се предвидат прецизни тридимензионални структури. Друг пристап „базиран на знаење“ е користење на бази на податоци на познати структури и секвенци за обука на модели преку вештачка интелигенција и машинско учење (AI-ML). Хасабис и Џампер применуваат елементи и од физиката и од AI-ML, но иновацијата и скокот во перформансите на пристапот произлегуваат првенствено од AI-ML. Двајцата истражувачи креативно комбинираа големи јавни бази на податоци со индустриски компјутерски ресурси за да го создадат AlphaFold.
Како знаеме дека ја „решиле“ загатката за структурно предвидување? Во 1994 година беше основан натпреварот за критичка проценка на предвидувањето на структурата (CASP), кој се одржува на секои две години за да се следи напредокот на структурното предвидување. Истражувачите ќе ја споделат 1D секвенцата на протеинот чија структура неодамна ја решиле, но чии резултати сè уште не се објавени. Предиктор ја предвидува тродимензионалната структура користејќи ја оваа 1D секвенца, а евалуаторот независно го оценува квалитетот на предвидените резултати споредувајќи ги со тродимензионалната структура обезбедена од експерименталистот (обезбедена само на евалуаторот). CASP спроведува вистински слепи прегледи и евидентира периодични скокови на перформансите поврзани со методолошки иновации. На 14-тата конференција на CASP во 2020 година, резултатите од предвидувањето на AlphaFold покажаа таков скок во перформансите што организаторите објавија дека проблемот со 3D предвидување на структурата е решен: точноста на повеќето предвидувања беше блиску до онаа на експерименталните мерења.
Поширокото значење е во тоа што работата на Хасабис и Џампер убедливо покажува како AI-ML би можела да ја трансформира науката. Нивното истражување покажува дека AI-ML може да изгради сложени научни хипотези од повеќе извори на податоци, дека механизмите на внимание (слични на оние во ChatGPT) можат да откријат клучни зависности и корелации во изворите на податоци и дека AI-ML може сам да го процени квалитетот на своите излезни резултати. AI-ML во суштина се занимава со наука.
Време на објавување: 23 септември 2023 година




