Nekst z Borsukiem podbiją internet?

| Utworzono: 2014-01-16 10:40 | Zmodyfikowano: 2014-05-01 00:12
Nekst z Borsukiem podbiją internet?  - fot. archiwum prw.pl
fot. archiwum prw.pl

Naukowcy uczą program, żeby rozróżniał całe frazy czy polskie nazwy własne. A to nie koniec.

Częścią nowej wyszukiwarki będzie program Borsuk, który odpowie nam na każde pytanie - o ile odpowiedź znajduje się w polskich tekstach.

- To pierwszy tego typu system w naszym kraju - opowiada jeden z ojców Borskuka, doktor Maciej Piasecki z wrocławskiej Politechniki.

Na razie twórcom polskiej wyszukiwarki udało się zebrać 160 mln polskojęzycznych dokumentów, a więc ok. 16 proc. polskiego internetu. Do czerwca ma być to pół miliarda tekstów i wtedy przeglądarka trafi w ręce internautów.

- Nawet Google czy Yahoo, przy całej swojej potędze, prawdopodobnie nie mają zebranego całego polskiego internetu - przyznaje kierownik projektu, prof. Jacek Koronacki, dyrektor IPI PAN. Szacuje, że wyszukiwarki te gromadzić mogą np. tylko co piąty dokument po polsku.

Polska wyszukiwarka będzie działała według całkiem innych algorytmów niż największe wyszukiwarki międzynarodowe. - Te wyszukiwarki nie mają mechanizmów, które naśladowałyby rozumienie języka - opowiada prof. Koronacki i podkreśla, że Nekst będzie pierwszą w Europie tak dużą wyszukiwarką semantyczną dla narodowego języka.

I tak przykładowo, jeśli internauta zapyta o opony, Nekst ujednoznaczni zapytanie i dopyta, czy chodzi o opony samochodowe (bo może też chodzić opony mózgowe). Pokaże szukającemu linki także do stron, w których nie ma frazy "opony samochodowe", ale występuje rdzeń słowa "opony" i pojawiają się inne słowa, które wskażą, że strona rzeczywiście poświęcona jest motoryzacji.

Naukowcy pracują też nad tym, by ich system potrafił analizować wydźwięk emocjonalny danej wypowiedzi. Mechanizm będzie umiał rozpoznać, czy o danym zjawisku, firmie czy osobie mówi się w pozytywny czy w negatywny sposób. Uczestnicy projektu Nekst chcą też, by ich system w przyszłości usprawnił wykrywanie plagiatów.

W ramach projektu trwają też prace nad analizą obrazów - wyszukiwarka w dokumentach będzie mogła po pewnego stopnia rozpoznawać, co jest na ilustracjach.


Komentarze (2)
Dodając komentarz do artykułu akceptujesz regulamin strony.
Radio Wrocław nie odpowiada za treść komentarzy.
~Marek2015-02-19 19:40:53 z adresu IP: (31.41.xxx.xxx)
Czekam z niecierpliwością na start Borsuka. Gdy to się stanie podziękuję google. Mam już dość szpiegowania
~DanBK2014-01-16 11:31:05 z adresu IP: (194.31.xxx.xxx)
Bardzo podoba mi się ten pomysł. Trzymam kciuki za wykonanie.