nauka

O tym jak IBM Watsona slangu uczył

Ray Kurzweil chciałby, by komputery ostatecznie zrozumiały znaczenie słów. Zanim to jednak nastąpi, muszą nauczyć się płynnie operować językiem. W ramach prowadzonych w tym kierunku badań, naukowcy zatrudnieni w IBM postanowili nauczyć Watsona slangu.

Watson, dziecko inżynierów IBM, które może poszczycić się wygraną w teleturnieju Jeopardy, jest jednym z najbardziej zaawansowanych superkomputerów, który może odpowiadać na pytania w języku naturalnym. Problem w tym, że nie jest w stanie zrozumieć różnic pomiędzy różnymi stylami funkcjonalnymi języka. Eric Brown otrzymał swego czasu zadanie nauczenia Watsona rozpoznawania tych subtelnych różnic.

Badania w tym kierunku rozpoczęły się już dwa lata temu, kiedy to Brown wykorzystał zawartość strony Urban Dictionary by nauczyć Watsona slangu miejskiego. W sumie logiczne, skoro w bazie danych tej strony można znaleźć wyjaśnienie praktycznie każdego potocznego zwrotu stosowanego w języku angielskim. Niestety, nawet z poszerzonym słownictwem, Watson nie był w stanie przełączać się pomiędzy stylami funkcjonalnymi tak dobrze, jak robią to ludzie.

Nauczenie maszyny operowania językiem naturalnym na takim poziomie, nawet jeśli byłby to angielski, który posiada relatywnie prostą gramatykę, okazało się być jednak wtedy niemożliwe. Za to po lekturze Urban Dictionary, Watson nabrał niezbyt chlubnych „nawyków językowych” – podczas testów zdarzało mu się odpowiadać na pytania przy pomocy przekleństw.

Ostatecznie inżynierowie IBM opracowali filtr, który powstrzymał Watsona przed przeklinaniem i skasowali dane pochodzące z Urban Dictionary. Choć może się to wydawać zabawne, dobrze pokazuje, że jeszcze sporo czasu musi upłynąć zanim komputery będą mogły się z nami komunikować w całkowicie naturalny sposób.

Tymczasem Brown uczy Watsona porozumiewać się z lekarzami w ramach projektu stosowania superkomputera jako narzędzia diagnostycznego w medycynie. Do tego celu Watson nie musi wcale znać slangu, wystarczy mu specjalistyczna terminologia.


podobne treści