MEHANIZMI OTKRIVANJA GOVORA MRŽNJE POMOĆU UMJETNE INTELIGENCIJE

Source: vectorjuice via Freepik

U današnjem digitalnom dobu platforme se sve više oslanjaju na umjetnu inteligenciju (AI) za praćenje i reguliranje online sadržaja. Jedno od ključnih područja u kojem AI ima važnu ulogu jest otkrivanje i uklanjanje govora mržnje.

Autorica: Anna Krainova

Ako napišete komentar koji sadrži govor mržnje ili postavite pitanje koje uključuje očitu predrasudu, vaš će tekst vjerojatno biti automatski izbrisan. Na primjer, ako pitam ChatGPT o jednom često prisutnom stereotipu o Romima da navodno kradu djecu, moje je pitanje odmah uklonjeno. Takav upit je uvredljiv i krši pravila platforme. Kako AI prepoznaje mržnju i netoleranciju?

AI je treniran za prepoznavanje govora mržnje pomoću posebnih tehnologija kao što su strojno učenje, obrada prirodnog jezika i analiza sentimenta. U tom kontekstu nedavno se pojavilo novo zanimanje – AI trener, čiji je zadatak i „podučavanje” AI sustava kako prepoznati govor mržnje. Algoritmi omogućuju procjenu teksta na temelju analize izbora riječi, sintakse (načina građenja rečenica) i općeg konteksta.

Jedan od alata za „treniranje” AI-ja je strojno učenje, koje ima za cilj razvijanje algoritama za samostalno donošenje predviđanja i odluka. Najprije se unosi velika količina podataka, zatim se izdvajaju bitne značajke iz tih podataka, a tek nakon toga algoritmi uče obrasce. Jednostavno rečeno, potrebno je AI-ju pokazati dovoljno primjera označenih kao „govor mržnje” i „nije govor mržnje” kako bi mogao uočiti razlike i oblikovati obrazac za prepoznavanje govora mržnje. Strojno učenje pomaže u praćenju i detekciji govora mržnje primjenom algoritama koji analiziraju jezične značajke i identificiraju riječi koje krše pravila platforme.

Sljedeća tehnologija koju treba objasniti je obrada prirodnog jezika. To je način na koji AI razumije i koristi ljudski jezik u praksi, sa svim njegovim nijansama. Upravo tako AI može prepoznati skrivene uvrede i mržnju.

Analiza sentimenta i dalje je problematičan dio jer AI može pogrešno protumačiti tekst zbog kulturnog konteksta, sarkazma, humora, slenga i slično. Ona je ključna za prepoznavanje govora mržnje, ali i jedan od razloga zašto AI ponekad ima poteškoća u njegovom otkrivanju, jer se takve izjave često temelje na kulturnom ili situacijskom kontekstu. Na primjer, neke uvredljive izjave povezane su s nedavnim lokalnim događajima koje AI ne može poznavati, pa ih ne može prepoznati – ali govor mržnje i dalje ostaje govor mržnje.

Na kraju, koriste se napredni algoritmi za analizu konteksta i prepoznavanje svih potencijalnih rizika. Unaprjeđenjem tih aspekata AI može napraviti značajan napredak u prepoznavanju i suzbijanju govora mržnje. U slučaju prepoznavanja govora mržnje, AI može dodati upozorenje i potaknuti korisnike na razgovor o stereotipima.

Osim govora mržnje (uključujući i govor mržnje prema nacionalnim manjinama), postoji još nekoliko zabranjenih tema za AI, kao što su nezakonite aktivnosti, štetan sadržaj (samoozljeđivanje, poremećaji prehrane itd.), neprimjeren sadržaj, kršenje privatnosti, medicinski i financijski savjeti, plagijat, poricanje povijesnih događaja (u slučaju Roma, poricanje Porajmosa), uznemiravanje i nacionalna mržnja (primjerice tvrdnje da Romi ne mogu živjeti u određenoj zemlji jer ne pripadaju „našoj naciji”).

Primjenom strojnog učenja, obrade prirodnog jezika i analize sentimenta, AI sustavi mogu se naučiti prepoznavati i označavati uvredljiv sadržaj na temelju jezičnih obrazaca i konteksta. Međutim, još uvijek postoje prepreke koje treba prevladati, poput boljeg razumijevanja kulturnih nijansi, sarkazma i situacijskog konteksta, što često može dovesti do pogrešnih tumačenja.