Timp de mai bine de 20 de ani, Kit Lofstadt a scris fan fiction care explorează alte lumi pentru eroii din Războiul Stelelor și răufăcătorii lui Buffy ucigașul de vampiri și și-a împărtășit poveștile online gratuit.
Dar în mai, doamna Lofstadt a spus că o companie de date i-a copiat poveștile și le-a transformat în tehnologie de inteligență artificială subiacent Chat GPT, un chatbot viral. Consternat, ea a ascuns scrisul în spatele unui cont blocat.
MERSI. Lofstadt a ajutat, de asemenea, la organizarea unei insurgențe împotriva sistemelor AI luna trecută. Alături de zeci de alți autori de fan-fiction, ea a publicat un val de povești ireverente online pentru a copleși și a confunda serviciile de colectare a datelor care alimentează tehnologia AI cu munca autorilor.
„Fiecare dintre noi trebuie să facă tot ce poate pentru a arăta că roadele creativității noastre nu sunt ceea ce mașinile pot recolta”, a spus ea. Actor vocal de 42 de ani din Lofstadt, South Yorkshire, Marea Britanie.
Scriitorii de fan-fiction sunt doar un grup de oameni care se răzvrătesc în prezent împotriva sistemelor AI. entuziasm pentru tehnologie A captivat Silicon Valley și lumea.În ultimele luni, companii de social media precum Reddit și Twitter, posturi de știri precum The New York Times și NBC News și scriitori și actrițe precum Paul Tremblay. Sarah Silverman Fiecare companie are o poziție împotriva AI sifonării datelor fără permisiune.
Protestele lor iau mai multe forme. Scriitorii și artiștii blochează fișiere sau boicotează anumite site-uri web care publică conținut generat de AI pentru a-și proteja munca, în timp ce companii precum Reddit doresc să facă acest lucru. Taxa de acces la data lor. Cel puțin 10 procese au fost intentate în acest an împotriva companiilor de inteligență artificială pentru antrenarea sistemelor lor bazate pe munca creativă a artiștilor fără consimțământul acestora.Săptămâna trecută, doamna Silberman și autorii Christopher Golden și Richard Cudley suedez OpenAI, creatorul ChatGPT și alții se luptă pentru utilizarea artefactelor de către AI.
În centrul rebeliunii se află o nouă înțelegere: informatii online Poveștile, lucrările de artă, articolele de știri, postările pe panoul de mesaje, fotografiile etc. pot avea o valoare semnificativă neexploatată.
Noul val de IA, cunoscut sub numele de „IA generativă” pentru textul, imaginile și alt conținut pe care îl generează, este construit pe sisteme complexe precum: model de limbaj la scară largă, poate produce o proză asemănătoare omului. Aceste modele sunt instruite pe acumularea de tot felul de date, astfel încât să poată răspunde la întrebările oamenilor, să imite stilurile de scriere și să producă comedie și poezie.
Acest lucru a dat startul unei mișcări a companiilor de tehnologie de a căuta mai multe date pentru a-și alimenta sistemele AI. Google, Meta și OpenAI au folosit în esență informații de pe internet, inclusiv baze de date mari de fan fiction, comori de articole de știri și colecții de cărți, multe dintre acestea fiind disponibile gratuit online. În limbajul industriei tehnologice, acest lucru era cunoscut sub numele de „răzuire” a internetului.
GPT-3 de la OpenAI, un sistem AI lansat în 2020, care se întinde pe 500 de miliarde de „jetoane”, fiecare reprezentând un subset de cuvinte găsite în principal online. Unele modele AI se întind pe peste 1 trilion de jetoane.
Internet scraping există de ani de zile și a fost în mare măsură expusă de companiile și organizațiile non-profit care au făcut-o. Cu toate acestea, nu a fost bine înțeles sau considerat deosebit de problematic de către companiile care dețineau datele. Acest lucru s-a schimbat atunci când ChatGPT a debutat în noiembrie, iar publicul a aflat mai multe despre modelele de inteligență artificială subiacente care alimentează chatboții.
„Ceea ce se întâmplă aici este o recalibrare fundamentală a valorii datelor”, a declarat Brandon Duderstadt, fondator și CEO al companiei de inteligență artificială Nomic. „Anterior, ne-am gândit că putem obține valoare din datele expunându-le tuturor și difuzând reclame. Se poate considera blocarea datelor.”
Protestele de date pot avea un efect redus pe termen lung. Giganții tehnologici de lux precum Google și Microsoft au deja o mulțime de informații proprietare și resursele pentru a le licenția. Însă zilele de scraping ușoară de conținut se apropie de sfârșit, iar startup-urile mai mici de AI și organizațiile nonprofit care doreau să concureze cu marile companii s-ar putea să nu aibă suficient conținut pentru a-și instrui sistemele.
Într-o declarație, OpenAI a spus că ChatGPT a fost instruit pe „conținut licențiat, conținut disponibil public și conținut creat de formatori umani AI”. „Respectăm drepturile creatorilor și autorilor și așteptăm cu nerăbdare să continuăm să lucrăm împreună pentru a le proteja interesele”, a adăugat el.
Într-o declarație, Google a declarat că participă la discuții despre modul în care editorii își pot controla conținutul în viitor. Compania a spus că „crede că toată lumea poate beneficia de un ecosistem de conținut vibrant”. Microsoft nu a răspuns la o solicitare de comentarii.
O revoltă a datelor a izbucnit anul trecut, după ce ChatGPT a devenit un fenomen global. În noiembrie un grup de programatori a intentat un proces colectiv A dat în judecată Microsoft și OpenAI că și-au încălcat drepturile de autor după ce codul lor a fost folosit pentru a instrui asistenți de programare bazați pe inteligență artificială.
Getty Images, care furnizează fotografii și videoclipuri de stoc, a intentat un proces în ianuarie. Stabilitatea AIo companie de inteligență artificială care creează imagini din descrieri de text, susține că startup-ul a folosit fotografii protejate prin drepturi de autor pentru a-și antrena sistemul.
Apoi, în iunie, firma de avocatură Clarkson din Los Angeles a intentat un proces colectiv de 151 de pagini împotriva OpenAI și Microsoft, explicând modul în care OpenAI a colectat date de la minori și scraping web. El a susținut că a încălcat legea drepturilor de autor și că a fost „furt”. Compania a depus un proces similar împotriva Google marți.
Ryan Clarkson a spus: „Rebeliunea datelor din toată țara este un răspuns al societății la ideea că marile companii de tehnologie au dreptul să ia orice informație din orice sursă și să o facă proprie. Este un instrument”, a spus el. Fondatorul Clarkson.
Profesorul la Facultatea de Drept de la Universitatea Santa Clara, Eric Goldman, a spus că acuzațiile procesului sunt ample și puțin probabil să fie acceptate în instanță. Dar valul de procese abia începe și vor exista „al doilea și al treilea val” care vor defini viitorul AI, a spus el.
Marile companii se împing, de asemenea, împotriva scrapers AI. in aprilie, a spus reddit Compania dorea să taxeze pentru accesul la o interfață de programare a aplicațiilor (API), o modalitate prin care terții pot descărca și analiza baza de date vastă a unei rețele sociale de conversații interpersonale.
CEO-ul Reddit, Steve Huffman, a declarat la acea vreme că compania „nu trebuie să dea toată valoarea sa unora dintre cele mai mari companii din lume”.
În aceeași lună, Stack Overflow, un site de întrebări și răspunsuri pentru programatori de computere, a anunțat, de asemenea, că va solicita companiilor AI să plătească pentru datele sale. Site-ul are aproximativ 60 de milioane de întrebări și răspunsuri.Transferul lui a fost raportat anterior Prin cablu.
Posturile de știri se opun, de asemenea, sistemelor AI. Într-o notă internă despre utilizarea AI generativă din iunie, The Times a spus că companiile de AI ar trebui să „respecte proprietatea intelectuală”. O purtătoare de cuvânt a Times a refuzat să detalieze.
Pentru artiști și scriitori individuali, lupta cu sistemele AI înseamnă regândirea unde publică.
Nicholas Cole, un ilustrator în vârstă de 35 de ani din Vancouver, Columbia Britanică, era îngrijorat de modul în care stilul său unic de artă ar putea fi replicat printr-un sistem AI și s-a întrebat dacă tehnologia îi distruge munca. Mă îndoiam. Intenționează să-și posteze în continuare munca pe Instagram, Twitter și alte site-uri de socializare pentru a atrage clienți, dar va continua să facă acest lucru, cum ar fi ArtStation, care postează conținut generat de inteligență artificială alături de conținut generat de oameni. site-ul.
„Se simte ca un furt inutil din partea mea și a altor artiști”, a spus Cole. „Îmi pune o gaură de groază existențială în stomac”.
La Archive of Our Own, o bază de date de fanfiction cu peste 11 milioane de povești, autorii cresc presiunea asupra site-ului pentru a interzice data scraping și poveștile generate de AI.
În luna mai, zeci de scriitori s-au ridicat în arme când unele conturi de Twitter au distribuit exemple de ChatGPT care imita stilul de fanfiction popular postat pe Arhiva propriei noastre. Și-au blocat poveștile și au scris conținut subversiv pentru a-i induce în eroare pe scrapers AI. De asemenea, au făcut presiuni pe liderul Arhivei proprii să nu mai permită conținutul generat de inteligență artificială.
Betsy Rosenblatt, care oferă consultanță juridică pentru The Archives of Our Own și este profesor de drept la Universitatea din Tulsa, a spus că site-ul are o politică de „incluziune maximă” și care sunt articolele. El a spus că nu vrea pentru a fi în măsură să stabilească despre ce era vorba. scris cu AI
Scriitorul de fan-fiction Lofstadt a avut ideea să lupte cu inteligența artificială în timp ce scria o poveste despre Horizon Zero Dawn, un joc video în care oamenii se luptă cu roboți alimentați cu inteligență artificială într-o lume post-apocaliptică. În jocuri, spunea ea, erau roboți buni și roboți răi.
Dar în lumea reală, „aroganța și lăcomia corporativă i-au deformat să facă lucruri rele”, spune ea.