Kan vi arkivera all kunskap?

TEXT: CLAES-MAGNUS BERG

Nej, det kan vi inte. Och det blir snarare systematiska än slumpmässiga fel.

INTERNET ARCHIVE – med webbadressen archive.org – grundades 1996 med ambitionen att ge ”universell tillgång till all kunskap”. Arkivet har hittills samlat in mer än 900 miljarder webbsidor, miljontals böcker och datorprogram, och framstår som en av mänsklighetens mest omfattande dokumentsamlingar.

Men likt den argentinske författaren Jorge Luis Borges karaktär Funes, som minns allt men saknar förmågan att abstrahera, ställer detta kolossala arkiv stora krav på användarna. Att tolka, prioritera och skapa mening i en nästan obegränsad informationsmängd blir en nödvändig färdighet – för utan relevanta abstraktioner, ingen verklig förståelse.

Historiker har länge debatterat hur vi ska använda och tolka historiska arkiv. Den tyske 1800-talshistorikern Leopold von Ranke skulle sannolikt ha sett Internet Archive som en möjlighet att närma sig historien ”som den verkligen var”, tack vare tillgången på primärkällor som annars lätt förvrängs av tolkningar. Problemet är väl bara att förstå hur någonting kan vara något annat än en tolkning?

Nåväl, det största problemet är nog att tekniska begränsningar visserligen förser oss
med myriader av data men oftast utelämnar så kallade single page applications (de flesta mer avancerade applikationer), innehåll med betalvägg eller annan inloggning, sidor som uttryckligen har valt att inte bli arkiverade i sin robot.txt-fil, samt snabbt föränderligt material i stil med X, Facebook och Reddit. Och eftersom detta innehåll inte finns med, kunde man kanske redan där tycka att idén att ”demokratiskt” hamstra alla data inte är mer än en fin idé.

SAMTIDIGT REPRESENTERAR Internet Archive något radikalt annorlunda än traditionella arkiv och kunskapsprojekt. Det är en ”demokratisk” motsvarighet till den franska Encyklopedin, som under 1700-talet valde ut och samlade kunskap från eliten inom snart sagt alla etablerade områden. Internet Archive gör precis tvärtom – det arkiverar ju allt, från bloggar och forum till vetenskapliga artiklar. Så länge de är öppna, vill säga.

Resultatet är därför en spegelbild av ”folket” snarare än av eliten. Men här uppstår också en paradox: även om detta låter inkluderande och flott, kräver ett arkiv av denna omfattning en särskild kompetens för att hanteras. För kommer det i själva verket inte att krävas en ny form av ”elit” – tekniskt kunniga och tolkningsförmögna – för att göra något meningsfullt av materialet?
Trots dess demokratiska yttre, vore det rentav inte möjligt att hävda att Internet Archive ställer ännu högre krav än tidigare elitprojekt? Den som vill dra nytta av arkivet måste kunna navigera dess komplexitet, förstå dess strukturer och göra svåra urval i en samling långt större än alla andra.

Å andra sidan är det kanske inte heller arkivets ambition att vara till för ett svårinringat ”folket” – syftet är snarare att ”hoarda” data som ”kan vara bra att ha” för forskare, journalister, samhällsdebattörer, författare och andra. Vore det inte för att digital teknologi kan öppna upp ett universum på en försvinnande liten yta, vore den fysiska motsvarigheten där ”allt” lagras mest deprimerande, lite som inledningsscenen i barnfilmen Wall-E (sopberg utan slut).

FRIEDRICH NIETZSCHE erbjuder en lämplig ram för att tänka på detta dilemma. I Om historiens nytta och skada för livet (1874) beskriver han tre sätt att använda historia: monumentalt, som inspiration från det förflutna; arkivistiskt, för intellektuell distans; samt kritiskt, där vi aktivt väljer vad som är relevant för oss i dag. Internet Archive passar särskilt väl för Nietzsches kritiska metod. Arkivets enorma omfattning tvingar oss att prioritera, tolka och engagera oss i en dialog med materialet. Det är inte en neutral behållare av kunskap – arkivet kräver vår aktiva medverkan för att bli meningsfullt.

Som idéhistorikern Michel Foucault påminner oss om är arkiv aldrig opolitiska. Även om Internet Archive försöker vara så inkluderande som möjligt, påverkas det av teknik och juridik som styr vad som kan fångas. Detta återspeglar i sin tur olika maktstrukturer där vissa röster och visst material marginaliseras, medan annat dominerar. Intressant nog dock alltså inte ”elitens” material, eftersom det sannolikt i långt högre utsträckning är dolt bakom betal- och inloggningsväggar (och då alltså inte ingår i arkivet).

Internet Archive erbjuder alltså något unikt: en plats där vardagliga röster, bloggar och forum får en chans att bevaras vid sidan av mer officiella dokument och vetenskapliga artiklar. Denna mångfald öppnar dörrar till nya typer av historieskrivning som inkluderar bredare delar av samhället. Men detta kräver en medveten användning.
Arkivet är inte bara en samling av det förflutna, utan faktiskt också en resurs för att förstå samtiden och forma framtiden. En sak som oroar mig är tendensen i samhället att gå ifrån tryckt material, som jag tror många gånger tål tidens tand bättre än digitala motsvarigheter. Pappersdokument av olika slag, inklusive böcker och tidskrifter, ersätts alltmer av filer på nätet. Massor av artiklar som är skyddade bakom väggar – inloggsskyddade eller som använder ”fel” teknik – blir inte bevarade därför att publikationerna varken trycktes eller inkluderades i arkivet, trots att de vore väl värda att bevaras. Och antagligen kan det bli så att omfattningen – om några få år en biljon dokument – gör att ytterst få forskare eller andra användare kommer att ägna sig åt de där andra texterna, de som inte råkade komma med i arkivet.

UTAN EN AMBITION att analysera, tolka och kritiskt engagera oss med arkivets innehåll riskerar det att bli en passiv spegel av en kaotisk digital värld. Med rätt användning kan det dock bli en kraftfull resurs – inte bara för att spegla historien, utan också för att bättre förstå vår samtid och oss själva. Lite gammaldags humaniora har kanske, motsägelsefullt nog, aldrig varit så tidsenlig som i dag.

Sedan får jag medge att bilden som arkivet lär måla sannolikt inte blir lika vacker som Caravaggios Narkissos, även om det nog kan finnas en annan tematisk likhet vad gäller innehåll. Men kanske blir det AI agents som drar runt på webben och gör olika uppdrag som dras in i bilden, inte människor. Ett race to the bottom där AI, när mänskliga data är uttömda, tränas på AI-genererad smörja och skapar än mer icke-representativa spegelbilder, samt därefter som ”agenter” får små assistentuppdrag av människor som inte längre bryr sig om skillnaderna.

Kanske blir Internet Archive i framtiden inte bara ett arkiv, utan en gravsten över det mänskliga på internet? Om dead internet theory stämmer – att nätet gradvis fylls av AI-genererat brus – kan arkivet bli en spegel av en värld där autentiska röster tystnar. Frågan blir då inte bara vad vi bevarar, utan vad vi ens kan hitta. Om dagens arkiv redan kräver tolkning och urval, hur hanterar vi ett internet där AI skapar, arkiverar och återvinner sitt eget innehåll? När mänskliga spår tunnas ut, riskerar vi att fastna i en ändlös loop av syntetiska speglingar – en digital mise en abyme, en optisk rundgång, där originalen har försvunnit. Precis som om verkligheten vore en novell av Borges.

Din varukorg

Kassa

Kan vi arkivera all kunskap?