Komputer wyposażony w odpowiednie oprogramowanie jest w stanie zauważyć skomplikowane zależności, których ludzki umysł nigdy by nie dostrzegł. Tylko pozwólmy maszynie znaleźć reguły - mówi w rozmowie z PAP dr Rafał Kurczab, który w poszukiwaniu nowych leków używa algorytmów uczenia maszynowego (machine learning).

Uczenie maszynowe (ang. machine learning) to koncepcja zakładająca, że zamiast programować komputery do wykonywania konkretnych zadań – jak podchodzono do tego wcześniej – można zaprogramować je tak, aby rozpoznawały skomplikowane wzorce i doskonaliły swoje działanie w oparciu o zdobyte wcześniej dane.

To dzięki uczeniu maszynowemu wyszukiwarka Google jest coraz skuteczniejsza i uczy się, czego potrzebują od niej użytkownicy. I wystarczy czasem nawet kilka liter, aby "domyśliła się”, czego szukamy. Uczenie maszynowe coraz lepiej spisuje się też w pracy banków, sieci handlowych czy firm marketingowych - by precyzyjnie analizować potrzeby klientów, bazując na ich wcześniejszych działaniach.

SELEKCJA NIEZBYT NATURALNA

Ale uczenie maszynowe stosowane jest też przez naukowców. "Ja np. używam algorytmów uczenia maszynowego, aby szukać nowych związków aktywnych biologicznie" - mówi w rozmowie z PAP dr Rafał Kurczab z Instytutu Farmakologii PAN w Krakowie. Dodaje, że algorytmy uczenia maszynowego pomagają zoptymalizować dobór reagentów w syntezie chemicznej, co w konsekwencji pozwala na efektywniejsze poszukiwanie nowych związków aktywnych biologicznie.

"Za pomocą sztucznej inteligencji możemy szybciej i sprawniej przeszukiwać duże bazy danych - zawierające informacje o milionach związków, które zostały już zsyntezowane, albo które można wytworzyć" - opowiada dr Kurczab.

Podaje przykład, że koledzy z Uniwersytetu Jagiellońskiego poprosili go o wyselekcjonowanie związków, jakie można przygotować z dostępnych na rynku odczynników chemicznych, które najskuteczniej działałyby na pewien konkretny cel biologiczny. "Gdybyśmy wzięli wszystkie reagenty, które pasują do tej reakcji, to można by otrzymać ponad 51 mln różnych związków. A my stosując różne modele otrzymaliśmy listę 100 związków, które mogły być najbardziej skuteczne. Współpracownicy z UJ zsyntezowali je, a 80 z nich rzeczywiście było aktywnych" - opisuje dr Kurczab.

Zadania, z jakimi mierzą się algorytmy, mogą być różne. Czasami pokazuje się algorytmowi miejsce wiązania w receptorze, które ma konkretny kształt. I algorytm wyszukuje związek, który w ten kształt się może dobrze wpasować. Czasem z kolei znane są tylko związki, które na dany receptor działają i trzeba znaleźć do nich podobne, mimo że struktura samego receptora często jest nieznana.

"Chemikowi wystarczyłaby kartka z rysunkiem związku. On już będzie wiedział, jak szukać związków podobnych. A komputer musi po swojemu zrozumieć, czym taki związek jest" - opowiada naukowiec. I opisuje, że w poszukiwaniu nowych związków chemicznych algorytmy korzystać mogą z przestrzeni liczących setki wymiarów.

NOWE WYMIARY BADAŃ

Położenie punktu w trójwymiarowej przestrzeni opisywane jest trzema zmiennymi. Ale dlaczego kończyć na trzech danych? Obiekty można przecież opisywać mnóstwem różnych zmiennych, czyli "wymiarów". Jeśli np. chodzi o związki chemiczne, na jednej osi może być np. określana długość łańcucha węglowodorowego, na innej - obecność pierścienia aromatycznego, na kolejnych - obecność różnych pierwiastków czy grup funkcyjnych itp. Algorytmy uczenia maszynowego są w stanie skleić te dane i „zobaczyć” w nich wielowymiarowy kształt, który niesie wiele cennych informacji.

Zadaniem algorytmu będzie teraz wyszukanie w bazie kształtów podobnych. "Człowiek, nawet gdyby nad tymi danymi siedział bardzo długo, nie jest w stanie ich efektywnie analizować. Po prostu zaczyna brakować mu wyobraźni" - mówi dr Kurczab.

DOBRA KARMA

"Na początku >>karmimy<< algorytm danymi wejściowymi - o związkach, o których wiemy, że są aktywne" - opowiada rozmówca PAP. Wyjaśnia, że komputer sam sobie ma znaleźć między tymi związkami podobieństwo i określić łączące je cechy. A potem program wyszukuje obiekty o podobnej charakterystyce.

"Algorytmy uczenia maszynowego są w stanie wykonywać polecone im zadanie w bardzo abstrakcyjny sposób" - mówi chemik. I opowiada, że programy takie często wskazują w bazie obiekty, których podobieństwo do związków referencyjnych wcale nie jest oczywiste. A mimo to ich wybór w wielu wypadkach okazuje się strzałem w dziesiątkę.

Dr Kurczab używa algorytmów uczenia maszynowego do poszukiwania nowych leków. Ale zaznacza, że z algorytmów tych, używanych coraz chętniej w różnych sferach życia, mogą korzystać badacze z wielu różnych dziedzin. "Darmowe oprogramowanie dostępne jest w sieci. Mogą z niego korzystać np. chemicy, biolodzy, psychologowie i wszyscy ci, którzy muszą przetwarzać w swojej pracy duże i skomplikowane zbiory danych" - opowiada.


Źródło: www.naukawpolsce.pap.pl