Prečo si detektory AI myslia, že Ústavu USA napísala AI

Hack-n-Slash povedal:

Myslím si, že používanie ústavy na testovanie je trochu chybné.
Ignorovanie toho, že bol použitý ako zdrojový vstup... Nepísala to osoba, ale komisia.
Zdá sa mi, že to pravdepodobne normalizuje reč rovnakým spôsobom ako spracovanie AI.

Kliknutím rozbalíte...

Nie je chybný. To len ukazuje, že ak urobíte niečo výborom alebo prejdete rozsiahlym redakčným procesom, výsledkom môže byť text, ktorý má rovnaké vlastnosti, aké majú texty generované AI.

Ale len veľmi málo študentov to robí. Takže ak dostanete papier od študenta, tieto nástroje sú celkom dobré na to, aby ukázali to isté, čo hovorí váš pocit: „Tento študent nikdy predtým nepoužíval tento druh jazyka a nehovorte týmto spôsobom, takže tento článok pravdepodobne nie jeho jej".

AI je nástroj. Detektory AI sú nástroje.
Nie sú riešenia.
Použite ich na označenie kompozície a potom použite svoj vlastný úsudok. Ak nemôžete určiť sami, potom nemáte čo veriť AI, že zlyhá vašich študentov.

Podginator povedal:

Či sú tieto nástroje holisticky užitočné, je úplne iná konverzácia. Ak je chybovosť približne 10 %, ako sa zdá v článku, potom by som tvrdil, že pre pedagógov stále poskytujú určitú hodnotu.

Bolo by herkulovskou úlohou posunúť model vzdelávania na viac hovorený štýl. Pri nedostatočnom financovaní vzdelávania a rozmachu tried by som tvrdil, že v systémovom meradle je to na hranici nemožné.

Ak to však dokáže odhaliť pravdepodobné použitie AI, pedagógovia môžu zamerať svoju pozornosť na zistenie, či študent rozumie materiálu, ktorý napísali, alebo nie. Dovolím si tvrdiť, že pedagógovia sa budú musieť čoraz viac sústrediť na porozumenie, keďže samotné písanie textu je dnes už zdanlivo vyriešený problém.

Kliknutím rozbalíte...

Keď hovorím ako niekto z „skupiny pre politiku AI“ na mojej škole, 10 % falošne pozitívnych výsledkov je horšie ako zbytočné. Obvinenie študenta z podvádzania je obrovský podnik, ktorý berie obrovské množstvo energie od žalobcu aj od obvineného. Prepojený článok zo Stanfordu tiež poukazuje na to, že sadzba bude vyššia pre nerodilých hovorcov, čo je už mínovým poľom kvôli rozdielnym štandardom pre citácie a plagiátorstvo v rôznych krajín

Je lepšie byť so študentmi vopred o tom, kde presne môžu a kde nemôžu používať AI. Napríklad budúci rok budem mať vo svojej triede úlohu, aby som zdôraznil, že LLM nedá sa veriť, že generujú faktické informácie – nevytvoria len štúdie, ale aj citácie tiež. (A profesori môžu ľahko odhaliť falošný citát)

Ale ak to chcú použiť na to, aby im pomohli pri štruktúrovaní politického dokumentu (a dali mi vedieť, že sa používa), dokážem s tým žiť. Je to nástroj, najmä pre ľudí, ktorým môžu chýbať znalosti angličtiny. Vzhľadom na to, že firmy budú chcieť ľudí, ktorí dokážu efektívne využívať nové nástroje, nie je na škodu naučiť sa ich používať aj študenti.

Čítal som článok časopisu Economist, ktorý mal iné riešenie detekcie AI: V zásade dáte AI odtlačok prsta prostredníctvom výberu slov a potom tento odtlačok hľadáte. Vyberiete páry synoným, ako napríklad „veľký/veľký“. Ak má typické písmo pomer 80 veľkých k 20 veľkým, potom vaša AI používa 30:70. Ak to urobíte s dostatočným počtom párov slov, mali by ste byť schopní zistiť, či niečo dostatočne dlhé napísala AI.

Hlavnou nevýhodou je, že to vyžaduje nástroje AI, aby to implementovali, a keďže ich všeobecný prístup je „pravidlá sú pre porazených“, nevidím, že by sa to stalo.

Prepáč. V polovici som vlastne prestal čítať tento článok, pretože sa s tým jednoducho neviem vyrovnať. Naprogramovali sme AI na písanie textu. A teraz používame AI na určenie, či text píše AI alebo ľudia? Čo sa tu vlastne f deje a prečo?

AI trénuje text. AI potom napíše text podobný tomu, na ktorý sa trénoval. Samozrejme, že AI rozpozná text podobný tomu, na ktorý sa AI vycvičila a potom zapíše.

Prisahám, že som pre tento svet príliš starý. Zastavte tento nezmysel o AI. Prestaňte používať AI na písanie textu a predstierajte, že je to skutočný ľudský text. V skutočnosti prestaňte používať AI bodku.

A čo je najdôležitejšie: PRE LÁSKU VŠETKÉHO SVÄTÉHO A NESVÄTÉHO prestaňte AI súdiť čokoľvek. Čo sa s tebou deje? Čo dúfate, že týmto všetkým dosiahnete? A neodpovedajte „firemný zisk“, pretože sa mi z toho bude zvracať.

Veľmi dobrý článok, so záverom môžem len súhlasiť.

Tieto „nástroje na detekciu“ som netestoval so študentskými esejami, ale s dvoma ďalšími všeobecnejšími formami písania: blogovými príspevkami a firemnými webovými stránkami. Zatiaľ čo v prípade webových stránok si viete predstaviť prečo (nevýrazná, firemná reč sa už číta ako niečo generované robotom), výsledky boli hrozne zlé – 50 % až 80 % bolo deklarovaných ako „napísaných AI“, pretože text, o ktorom som vedel, že je to mnoho rokov starý.

Blogových príspevkov môže byť viac... mätúce, kým si človek neuvedomí, že mnohé online články nie sú mienené ako kvalitná literatúra, ale slúžia na upútanie pozornosti na mesto alebo na recenziu alebo povedzte vtipný príbeh, ktorý autora zaujal – všetky tieto položky sa dajú ľahko klasifikovať ako „napísané AI“ kvôli ich vnímaniu „jemnosť“.

V online komunitách som už videl aj obvinenia z toho, že ste to napísali pomocou AI. aj bez akejkoľvek formy dôkazu alebo kontroly, a to môže byť veľmi škodlivé pre niečie skoré pokusy výraz. Predstavte si, že strávite mesiace vytváraním niečoho vlastného, či už je to dobré alebo zlé, len aby ste boli okamžite odmietnutí ako „AI“...

Takže áno, tieto "detekčné" nástroje spôsobujú viac škody ako úžitku a mali by byť zakázané namiesto samotných LLM. V prípade potreby môžeme použiť aj iné spôsoby, ako ľahko zistiť autorstvo, ako je napríklad priama interakcia s autorom a kladenie otázok o diele – skutočný autor vám rád odpovie; falošný začne mumlať a vystrašene utečie.

Existuje spoločnosť AI s názvom "Hugging Face"?!

Čo si mysleli „S AI sa všetci tak sústredia na Skynet, že my Xenomorfi môžeme jednoducho vkĺznuť zadnými dverami!!!

Na titulnej strane majú dokonca odkaz na „Allenov inštitút pre AI“ KOHO SI MYSLIA, ŽE SI ŽIADU?

Pokiaľ to nie je bod „Prezrel náš smiešny podvod, OBJEMTE HO TVÁR“
Snímka obrazovky 2023-07-14 o 14.49.18.png

Bohužiaľ budú dosť dobré na to, aby boli implementované a podniknuté kroky proti falošným pozitívam, pretože to bude stáť menej ako použitie niečoho presného.

Niektoré dni si myslím, že mnohé, ak nie všetky, nedávne rozhodnutia SCOTUS napísala AI a nie sú skutočné.

McTurkey povedal:

Napríklad epizóda AI z najnovšej sezóny Black Mirror, štrajk spisovateľa a teraz štrajk herca (obe tieto veľmi podporujem), všetky ukazujú, že sa to blíži k vrcholu. Práve teraz sú čisto skripty generované AI stále vo fáze noviniek. To platilo o chatbotoch AI pred niekoľkými rokmi, ale teraz sa pohybujú medzi tajomným údolím a ľudským prechodom v závislosti od kontextu. Aj keď pokrok v akejkoľvek danej technickej oblasti nie je nikdy zaručený, zdá sa byť dosť pravdepodobné, že tam bude správne dobre predovšetkým filmový alebo televízny scenár napísaný umelou inteligenciou v priebehu nasledujúcich 10 – 15 rokov. Ak človek musí vylepšiť, ale nie prepísať veľké časti, je to veľmi odlišné od redakčného a kresliarskeho procesu, ktorým ľudskí spisovatelia zdokonaľujú svoje príbehy?

Kliknutím rozbalíte...

Kým AI nepochopí, čo vlastne píše, spochybňujem myšlienku, že a dobre Televízny/filmový scenár s motívmi, spätnými volaniami a vývojom postavy. Pokrok, ktorý sme dosiahli v oblasti AI, neprispieva k porozumeniu a seriózni výskumníci neočakávajú, že LLM niekedy bude rozumieť - to nerobí model AI.

B, ale áno, výrazne sa líši od súčasného systému pre TV. obrovské zmeny v procese písania epizódy, ktorá sa hodí na konkrétne miesto v sezóne, čo ešte zhoršila moderná citlivosť na serializáciu obsahu s dlhými oblúkmi. Znižuje úsilie o spoluprácu, ktoré v súčasnosti existuje, a vzhľadom na povahu v súčasnosti používanej AI uprednostňuje viac formulovaná skúsenosť so samostatným obsahom v rámci komplexného dlhodobého rozprávania príbehov, ktoré v poslednej dobe poháňali televízne prostredie rokov.

Okrem toho, že je jednoducho napísaná štýlom, ktorý už nie je hovorový, náhodou si myslím, že Ústava je len zle napísaná a mätúca. Druhý pozmeňujúci a doplňujúci návrh je možno najlepší (alebo najhorší) príklad, ale celá vec sa vyznačuje tupým a komplikovaným písaním na vyjadrenie jednoduchých pojmov, ktoré mali byť napísané jasnejšie.

Eseje sa budú musieť písať naživo bez telefónov. To je asi tak všetko.

Ianal povedal:

Nerozumiem, ako tu pomáha zmätok ako metrika. Ak čítam článok správne, nízke skóre zmätenosti naznačuje, že daný kus textu je podobný textu nachádzajúcemu sa v korpuse školení LLM, a preto ho pravdepodobne napísal an LLM.
Ako to pomôže, ak vezmeme do úvahy, že text tréningového korpusu napísali v prvom rade ľudia?

Kliknutím rozbalíte...

Vaše používanie čiarok je idiosynkratické (bez odtieňa - 8 slov a už používam zátvorky a pomlčky). "Tréningový text korpusu" dáva zmysel v kontexte, ale "text" je tu implikovaný korpusom a vo všeobecnosti by som očakával, že bude vynechaný. „je preto pravdepodobné“ sa cíti ako tik písania. Zmätenosť tvojho písania sa mi zdá ľudská.

Celý tento odsek je veľmi zmätený (okrem toho, že som zvláštny spisovateľ): metadiskusia analyzujúca zmätok niekoho písania nie je príliš pravdepodobná.

Takže aj keď sú ľudia v našom písaní tropey a témy spôsobujú predvídateľné používanie jazyka (keď sme povedali zmätok, bolo oveľa pravdepodobnejšie, že budete hovoriť veci ako „metrika“ a „text“); často hádžeme aj zvláštne odchýlky. Rovnako ako nikto v skutočnosti nevyzerá ako „priemerný“ človek.

Ak vyberiete najpravdepodobnejšie slovo v LLM, zachytia sa v slučkách (v slučkách v slučkách v slučkách...). Ak vyberiete nepravdepodobné slová, zvrhne sa to na nezmysel. Zdá sa, že tancovanie s pravdepodobnosťou tiež nefunguje dobre – nie je rovnako pravdepodobné, že si vyberieme slovo s nízkou zmätenosťou, len to dáva zmysel v určitých situáciách.

Úprimne povedané, toto všetko je pravdepodobne spojené s nedostatkom explicitných komunikačných cieľov v agentoch LLM a mám podozrenie, že ako posilnenie učenie pokračuje, čím sa viac integruje do jazykových modelov, začnú sa objavovať prirodzené variácie a text sa stane ľudskejším hľadiac.

Keďže som pracoval v K12 Edtech väčšiu časť posledných 15 rokov, môžem povedať, že každého, kto riadne vyhodnotil existujúce nástroje „akademickej integrity“, nič z toho neprekvapí. Akonáhle sa nástroje v štýle TurnItIn posunuli nad rámec zisťovania veľkoobchodného zdvíhania obsahu, rýchlo sa priblížili „o niečo lepšie ako náhodný klasifikátor“. Tieto nové „AI“ spoločnosti sú len nové obaly s luxusnejšími slovami okolo rovnakého hadieho oleja.

Bohužiaľ, existuje veľká skupina učiteľov a administrátorov K12, ktorí nie sú dostatočne sofistikovaní na to, aby pochopili alebo zhodnotili účinnosť týchto nástrojov. To vedie k tomu, že nástroje a ich „odporúčania“ sa používajú represívnym spôsobom proti študentom, ktorí robia málo pre ďalšie zvládnutie učiva alebo zručnosti celoživotného vzdelávania. Veľká časť korporátnej Ameriky opäť bojuje proti nefunkčným, užívateľsky nepriateľským technológiám a procesom, takže možno sú tieto nástroje dobrým tréningovým priestorom.

Problém, ako sa vyhnúť falošným pozitívam, predchádza uvoľneniu LLM. Môže to byť také staré ako samotná akademická esej.

Môj otec stále žartuje takmer 60 rokov po tom, čo dostal D-mínus na výskumnej práci pre prváka. Bol to podľa seba lenivý, nezaujatý študent, ktorý sa zrazu zapálil na záverečnom projekte a dal do toho všetko, čo mal. Jeho profesor, posudzujúci prácu podľa štandardov svojej predchádzajúcej práce, predpokladal, že ide o plagiát. Neexistoval žiadny dôkaz, inak by známka bola F.

S profesorom v tom príbehu súcitím, aj keď si nemyslím, že dať študentovi D za netypicky hviezdnu prácu bola správna voľba. Študenti sú na najrôznejších chaotických vzdelávacích trajektóriách a vždy bolo zložité zistiť, kto v skutočnosti dáva prácu a absorbuje lekcie a kto prišiel na spôsob, ako hrať hru systém.

Za tých pár rokov, čo som učil na vysokej škole, som zistil, že známkovanie písomiek je jednou z najbolestivejších častí práca pre mňa a nízka zložitosť a náročnosť práce študentov v C-priemere bola pravdepodobne veľkou súčasťou bolesť. Spolu s uvedenými štatistikami chybovosti som kvôli tomu skeptický voči nástrojom opísaným v článku. Vyzerajú ako ekvivalent lovu vlečnými sieťami pri dne – v sieti bude zmetených veľa nevinných morských živočíchov. Nie každé učenie sa však odráža v tom, ako silno niekto píše.

Niektorí skorší komentátori špekulovali, že možno budúce metódy hodnotenia budú mať v sebe zabudované viac ústnej prezentácie a dialógu. Dúfam, že týmto smerom sa uberá náš vzdelávací systém.

Pre mňa je zaujímavé, že každý príklad „pravdepodobne napísaný AI“ boli skôr spolupráce než príspevky jedného autora.

Variácie vo formulácii, štýle a iných aspektoch gramatiky by boli prediskutované a schválené výborom, nie jednotlivcom.

Vzhľadom na to, že AI by sa dala opísať ako „generovaný výborom“ vďaka použitým modelom školenia, potom to robí Zdalo by sa, že by to označilo spoločné úsilie za to, že nepochádza od jednej osoby, a preto je veľmi pravdepodobné generované AI.

Zábavné, „chcel by som šálku pavúkov“ je presne ten druh šialenstva, ktorý by som očakával od generatívnej AI, ale predpokladám, že toto pole už pokročilo.

Bez ohľadu na to je pre mňa mätúce, že ľudia očakávajú, že bude možné spoľahlivo odhaliť text generovaný AI. Ak systém dokáže identifikovať „tell“, prečo by sa ten istý systém nemohol použiť na jeho odstránenie? Ak máte informácie na to, aby ste zistili, že niečo nie je v poriadku, nemáte dostatok informácií aj na to, aby ste to napravili?

Iste, existujú chyby opomenutia, ako aj provízie, ale zdá sa nelogické predpokladať, že existujú nejaké neodstrániteľné chyby generatívnej AI.

Učiteľ, ktorý je zároveň odborníkom na danú látku, by sa potom mohol opýtať študentov na obsah ich práce, aby zistil, ako dobre jej rozumejú. Písanie nie je len demonštráciou vedomostí, ale aj projekciou povesti človeka, a ak áno ľudský autor nemôže stáť pri každej skutočnosti uvedenej v písaní, pomoc AI nebola použitá primerane.

Kliknutím rozbalíte...

Poznám vysokoškolskú učiteľku matematiky a núti študentov ukázať svoju prácu. Keď nie, a história toho študenta robí správnu odpoveď bez práce spochybniteľnou, ona označí otázku zle a povie im prečo, a ak nie, môžu jej prísť vysvetliť svoju odpoveď. Ešte ju nikto neskúsil. Nie som si istý, či sa to počíta ako 0 % falošne pozitívnych výsledkov, alebo či sú študenti príliš vystrašení/vystresovaní, aby sa bránili. Toto nie je etická komisia, ako sa uvádza v článku, len ona.

Idem tu po tangente, ale ešte na strednej škole koncom 90-tych rokov, keď som sa učil programovať TI-BASIC, môj prvý program bol niečo na hodine chémie na konverziu mólov/gramov/atómov látka. Urobil som, aby program ukázal kroky, ktoré zahŕňa kopírovanie do testu, takže nikto nebol múdrejší. V poslednom ročníku v kalkule som tieto užitočné malé programy zdieľal so spolužiakmi. Pamätám si, že som pri rozdávaní testov našiel v programe chybu a musel som niekoľkým ľuďom pošepkať, aby tomu neverili. Ako autor programu som látku dobre poznal. Ľudia, ktorým som dal program? Možno menej.

O pár rokov neskôr som sa rozprával so svojou učiteľkou kalkulu (poznal som jej syna) a ona zo žartu povedala, že jej chýbam ja a moje programy. Študentom sa bez nich tak dobre nedarí. Nie som si istý, či mám byť na to hrdý alebo nie. Boli to dobré programy.

Prial by som si, aby niektorí z mojich spolupracovníkov používali AI, aby im pomohla písať v angličtine, pretože momentálne nerozumiem ich angličtine, hoci niekedy si nie som istý, v čom je problém. Ako keby to bol nejaký problém s priamym prekladom, dobre by som tomu rozumel, alebo keby to bol len problém predmet – predmet – sloveso, ale namiesto toho Zdá sa, že je to taký zhluk zle napísaných hlúpostí, ktoré sa potom preložia pomocou Prekladača Google (čo je v skutočnosti úplne zbytočné text.)

waveterrain povedal:

Keďže som pracoval v K12 Edtech väčšiu časť posledných 15 rokov, môžem povedať, že každého, kto riadne vyhodnotil existujúce nástroje „akademickej integrity“, nič z toho neprekvapí. Akonáhle sa nástroje v štýle TurnItIn posunuli nad rámec zisťovania veľkoobchodného zdvíhania obsahu, rýchlo sa priblížili „o niečo lepšie ako náhodný klasifikátor“. Tieto nové „AI“ spoločnosti sú len nové obaly s luxusnejšími slovami okolo rovnakého hadieho oleja.
Bohužiaľ, existuje veľká skupina učiteľov a administrátorov K12, ktorí nie sú dostatočne sofistikovaní na to, aby pochopili alebo zhodnotili účinnosť týchto nástrojov. To vedie k tomu, že nástroje a ich „odporúčania“ sa používajú represívnym spôsobom proti študentom, ktorí robia málo pre ďalšie zvládnutie učiva alebo zručnosti celoživotného vzdelávania. Veľká časť korporátnej Ameriky opäť bojuje proti nefunkčným, užívateľsky nepriateľským technológiám a procesom, takže možno sú tieto nástroje dobrým tréningovým priestorom.

Kliknutím rozbalíte...

Práve uzatvárame bitku s univerzitou mojej dcéry kvôli obvineniu z plagiátorstva v kontrolovanom teste, kde bola ona a ďalší študent obvinení zo vzájomného kopírovania. Údaje sme nakoniec získali a je to samozrejmé v detailoch nad rámec širokej notifikácie štatistických odchýlok, nikoho nekopírovala.

Nakoniec sa jej podarilo zistiť, že nedošlo k plagiátorstvu, ale po niekoľkých dosť robustných výmenách názorov. Niekto s menšou podporou nemusí dosiahnuť rovnaký výsledok. Univerzitný vyšetrovateľ sa zdal byť natoľko závislý na skutočnosti, že program označil „vysokopravdepodobné kopírovanie“ fungoval na predpoklade zistenia viny, pretože počítač povedal, že niekto je vinný, a ignoroval všetky ostatné možné výklady.

Tieto nástroje budú prítomné a ako sa uvádza v článku, každý chce, aby fungovali. Ak tak neurobia, alebo keď im je poskytnutá neprimeraná autorita, riziká pre nevinného študenta sú vysoké s malým možným zmiernením.

Prečo si detektory AI myslia, že Ústavu USA napísala AI

Kategórie

Najnovší blogový príspevok

October 11, 2023

October 09, 2023

October 09, 2023

October 20, 2023

October 20, 2023

Tech Tips

Prečo si detektory AI myslia, že Ústavu USA napísala AI

Kategórie

Najnovší blogový príspevok

October 11, 2023

October 09, 2023

October 09, 2023