Projekt pod nazivom Sphere svoje znanje crpi iz "nestrukturiranog" otvorenog weba. Još uvijek je u fazi istraživanja.
Ovaj tjedan Meta je lansirala novi model umjetne inteligencije, nazvan Sphere, koji je dizajniran za automatsku provjeru citata na Wikipediji. Sphereova baza znanja dolazi od 134 milijuna web stranica.
Meta je rekla da nije partner s Wikimedijom (neprofitnom organizacijom koja posjeduje wikipedia.com) na ovom projektu, koji je još uvijek u fazi istraživanja i ne koristi se za ažuriranje uživo Wikipedia. Međutim, Wikimedia nedavno objavljeno da je koristio Metinu tehnologiju u svom alatu za prevođenje sadržaja.
Sfera, kaže Meta u a post na blogu, je AI model koji izvodi obradu prirodnog jezika koja zahtijeva znanje, isti zadatak koji virtualni pomoćnik na vašem telefonu obavlja kada postavite mu pitanje poput "tko je dobio prvu Nobelovu nagradu za fiziku?" Ti će modeli zatim prekopati repozitorij kako bi pronašli podudarnost odgovor.
U Sphereovom slučaju, koristi se informacijama s "nestrukturiranog" otvorenog weba za razliku od tražilice. "Budući da Sphere može pristupiti daleko većem broju javnih informacija od današnjih standardnih modela, mogao bi pružiti korisne informacije koje oni ne mogu", napisali su istraživači Mete u
blog objaviti. Osim toga, Metin sustav koristi razumijevanje prirodnog jezika za "procjenu vjerojatnosti da se tvrdnja može izvesti iz izvora." Ova tehnika se kvari rečenice ili izraze u matematičke prikaze, a zatim uspoređuje skupove prikaza sa svakim drugo.[Povezano: Meta želi poboljšati svoju umjetnu inteligenciju proučavajući ljudski mozak]
Preprint koji opisuje Sphere može se pronaći na arXiv, a sam softver je otvorenog koda na GitHub. Meta je također kreirala benchmark test tzv KILT koje će koristiti za procjenu izvedbe Spherea i drugih sličnih modela u širokom rasponu zadataka kao što su provjera činjenica, dijalog s pitanjima i odgovorima i umetanje relevantnih poveznica.
Ova je sposobnost do sada korištena samo za skeniranje i provjeru Wikipedijinih citata. "Skreće pozornost na upitne citate, dopuštajući ljudskim urednicima da procijene slučajeve za koje je najvjerojatnije da imaju manjkavosti, a da ne moraju prebirati po tisućama pravilno citiranih izjava", Meta objasnio. "Ako se citat čini nevažnim, naš model će predložiti primjenjiviji izvor, čak i ukazivati na određeni odlomak koji podupire tvrdnju."
[Povezano: 'Usvajanje pogrešaka pri upisu' i drugi načini uređivanja Wikipedije]
U konačnici, učenje razumijevanja odnosa između odlomaka teksta u unosima Wikipedije i poveznica koje oni citiraju također će poboljšati sposobnost modela da analizira znanje iz stvarnog svijeta, budući da uređivanje citata zahtijeva čvrsto razumijevanje ljudskog jezika i rasuđivanje.
“Ovi su modeli prve komponente potencijalnih editora koji bi mogli pomoći pri provjeri dokumenata u stvarnom vremenu. Osim predlaganja citata, sustav bi predložio auto-dovršeni tekst - na temelju relevantnih dokumenata pronađenih na webu - i ponudio ispravke lekture,” rekla je Meta. “U idealnom slučaju, modeli bi razumjeli više jezika i moći obraditi nekoliko vrsta medija, uključujući video, slike i podatkovne tablice.”