Utdrag av python-kode fra "Vålnes-saken" (NRK)

Det er en pytonslange i Nasjonalbiblioteket

Den er savnet. Trolig død. Og eierskapet må trolig spores i flere ledd til utlandet. Ikke betaler den skatt heller, men den har garantert fått uberettiget koronastøtte. Dette er det som preger årets metoderapporter...

Etter å ha lest de 62 rapportene, 1 083 sider i alt, kategorisert dem og logget de viktisget stikkordene, kan man se et visst mønser.

Det er som jury-leder Bernt Olufsen skrev i M24 tirsdag 29. mars, at det er nok ikke så mye ny overveldende metode i år, men noen metoder som vi kjenner fra før, trer tydeligere frem som foretrukne løsninger. Python som kodespråk, og oppslag i Nasjonalbiblioteket er to av disse. Det kommer tydelig frem i Fra Vålnes-sake (NRK) der journalistene skriver:

“Som en del av den grafiske profilen hadde vi behov for å få avisoppslagene digitalt. Etter noen undersøkelser kom vi fram til at Nasjonalbiblioteket hadde alt vi trengte: Alle aviser samlet på ett sted, god kvalitet på digitaliseringa – og det var mulig å få tak i avissidene ved hjelp av en algoritme.

Det er fire saker som omtaler savnede personer i år. Alle henviser til Nasjonalbiblioteket. Det er ikke bare søk etter artikler, men også dødsannonser og andre annonser. Nasjonalbiblioteket er nevnt en del ganger før, men da primært for å finne gamle bøker.

10 av årets metoderapporter viser til bruk av Nasjonalbiblioteket. Dette skiller seg ut fra tidligere år.

En gammel kjenning har også WaybackMachine (Archives.org) rukket å bli. Det er overraskende hvor ofte dette nokså enkle konseptet om å “reise bakover i tid” på nettet blir viktig i journalistikken. Tjenesten ble første gang nevnt, og brukt som en viktig del av undersøkelsene i TV2s “Et lite stykke Norge” så tidlig som i 2006, og har siden da blitt brukt i 22 prosjekter frem til i år nå.

Innsyn

Beskrivelser av innsynsprosesser er nok de aktivitetene som det brukes mest plass på å beskrive. I år er det særlig prosesser knyttet til å få innsyn i avsluttet politietterforskning, samt taushetsbelagt informasjon (§13), der myndighetene ikke gir innsyn til tross for at part(ene) har gitt samtykke, og ulike problemstillinger knyttet til innsyn i datasett (§9). Dette er kjente problemstillinger i SKUP-sammenheng, men årets beskrivelser gir enda mer verdifull læring for de som står i disse problemstillingen (som for kan være de fleste av oss).

Vi finner også noen ulike forklaringer på å gjøre innsyn i Stortinget. Stortinget er ikke underlagt de samme reglene for innsyn, men i Aftenpostens “ Pendlerboligene - Fra gutterom til stortingsskandale” vises det til eget forskift for innsyn

BTs “Salget av Bergen Eniges” forteller oss også at når en sak behandles av Kongen i statsråd, er sakspapirene - som de såkalte R-notatene - unntatt offentlighet. Men den ansvarlige statsråden skal også legge frem et såkalt statsrådsforedrag, som gir en detaljert gjennomgang av saken.

I saken om pendlerboligene forteller også Aftenposten om en ny teknikk som, hvis man er heldig, kan brukes på sladde dokumenter: “Ved å justere kontrast og lysstyrke på dokumentet i photoshop, kunne vi lese bak sladden.”

Samme avis kunne i fjor fortelle at ved å bruke en LED-lys klarte de i visse tilfeller å lese bak sladden dersom de holdt lyset i rett vinkel… ("Akson og konsultenmillionenene")

Å kartlegge eierskap på tvers av landegrenser

I flere av årets rapporter oppstår behovet for å kartlegge eierskap for selskaper i flere ledd. Noen ganger kan eierskapet gå mot utlandet, andre ganger går de i ring. Det fikk Klassekampen merke da de lagde et rekursivt skript som bladde bakover i eierskap så langt det gikk. Når eierskapet gikk i ring, så sluttet aldri koden å tenke, og da måtte journalistene tenke nytt. Vi finner noe lignende beskrevet i Adresseavsiens “Møllenberg til leie”(2018), men koden til Klassekampen er mer konkretisert og gjenbrukbar.

I nevnte “Salget Bergen Engines” bruker Bergens Tidende en internasjonal tjeneste kalt Orbis, som lar dem spore eierskap på tvers av land. For å nøste eierskap i flere ledd, bruker de Neo4j, et verktøy de også viser til i “Sakene politiet ikke etterforsket”.

Sosiale medier

Etter at vi har mistet muligheten for søk med Facebook Gragh (og tidligere Facebook API), forteller Faktisk.no om at mulighetene gjennom CrowdTangle nå har fått større verdi. Verktøyet er laget av Facebook selv, og er tilgjengelig for journalister. Redaksjonen skriver at dette gir mulighet for “...å laste ned «historiske rapporter» som inneholder Facebook-innlegg som matcher en gitt søkestreng i .csv-format.”. Disse kan videre behandles redaksjonelt, eller med annen programkode.

Flere har også blitt kjent med søketjenesten Pipl, som NRK: “Vi fant mannen i Pipl, en personsøkemotor vi abonnerer på, med tidligere telefonnumre.” Pipl.com ble også nevnt i en av fjorårets rapporter, men som NRK skriver videre: “Pipl har siden mistet mye verdi som researchverktøy, etter at de valgte å fjerne informasjon om EU-borgere som et resultat av GDPR-reguleringer. (fra “Mannen som ikke ble meldt savnet”),

Også Stavanger Aftenblad bruker tjenesten i “Mannen med den tomme graven”, og et definitift høydepunkt er at VG fant telefonnummeret til den tidligere skuespilleren, nå spesialutsending fra den russiske stat, Steven Seagal, gjennom Pipl i arbeidet “Sputnik-kuppet”.

Stadig flere ser på koronastøtten og mulige profittører. Det er kanskje ikke uventet at disse sakene også kommer i år, for regnskapstallene for det første koronaåret var ikke klare før høsten 2021.

I E24s gjennomgang krysser redaksjonen data om hvem som har fått støtte med selskapsinformasjon fra Brønnøysundregistrene. Metoden er relativt enkelt, fordi begge datasettene har organisasjonsnummer som primærnøkkel. Å krysse slike datasett er noe av det som gjennomgås i Kokebokens kapittel 12, om praktisk datajournalistikk. E24 valgte å bruke noe som ligner på RStudio, kalt Exploratory, til denne undersøkelsen. Det er ikke omtalt i rapporter tidligere, men kodespråket R er en del brukt de siste fem åra.

Ellers er altså Python det foretrukne kodespråket, gjerne med utvidelsen Pandas. Det betyr at det er få eller ingen henvisninger til SQL, JavaScript, PHP eller annen serverkode.

Faktisk.no bruker RStuido i “Det norske ekkokammeret”. Denne rapporten inneholder også noen detaljerte kodelinjer i python.

For de som vil ha tips til å undersøkelser på nettet, er Aftenpostens “Noen å hate” rapporten å lese. Den gir konkrete tips til verktøy som kan brukes for å lete opp personer og opplysninger i ulike registre.

Podkast erstatter radiosakene

Radio, det vil si podkast, er tilbake for fullt. Plattformen beskrives som hovedmedium eller viktig bimedium i en rekke saker: Memoar med “Virus - historier fra et annerledes år”, Stavanger Aftenblad med “Mannen med den tomme graven”, VGs “Fosterfaren” og “Grenseløs terapi”, Aftenpostens “De rakk ikke å bli voksne”, samt Oppland Arbeiderblads sak om dataangrepet i Østre Toten kommune. Hele Aftenpostens “Noen å hate” er formidlet som podkast. Sist gang et radiobidrag ble sendt inn til SKUP var i 2014, mens gullalderen nok må sies å være slutten av 90-tallet.


Tilbake




Nettsiden er administrert av Espen Sørmo Strømme, NLA Høgskolen.