Metodikk for modernisering av statistikkproduksjonen
Working paper

View/ Open
Date
2020-05Metadata
Show full item recordCollections
- Notater / Documents [987]
Abstract
Det første som ble utarbeidet i arbeidet med å modernisere statistikkproduksjonen
er hvilke prinsipper en moderne produksjon bør vektlegge. Disse prinsippene
gjelder temaer som faglig forankring, metadata, dokumentasjon, arkivering,
automatisering, dataeditering, kvalitet, evaluering og effektive metoder.
Det grunnleggende for å bygge en statistikkproduksjon er å ha tilgang til
funksjoner. Nødvendige funksjoner har blitt identifisert og kategorisert her/i dette
notatet. Funksjoner må være tilgjengelig for statistikkproduksjonen ved at de enten
finnes i et programmeringsspråk man har tilgang til, kan bygges av statistikk produsenten selv eller kan tas i bruk via bruk av «internasjonale biblioteker», slik
som for eksempel Cran for de som bruker programmeringsspråket R.
Deretter har vi sett på hvordan funksjoner kan settes sammen til en prosess. De
fleste prosesser har minst tre prosessteg - forprosess, hovedprosess og etterprosess.
Forprosessen er ofte en tilrettelegging av data for hovedprosessen, mens
etterprosessen er en kontroll av at hovedprosessen har gjort det den skal med
tilfredsstillende kvalitet.
Data går bearbeides gjennom hele produksjonsprosessen. En datatilstand er et
datasett med metadata på et gitt punkt i produksjonsprosessen. Hovedtilstandene er
de viktigste datatilstander i produksjonsprosessen: rådata, inndata, klargjorte data,
statistikkdata og utdata. Vi har laget en oversikt over hvilke delprosesser som
inngår i utarbeidelsen av hver hovedtilstand og hvilke kvalitetskriterier hver av
hovedtilstandene har.
Deretter har vi laget forslag til hvilke kvalitetsmål som kan beregnes for å kunne
måle om kvalitetskravene til hovedtilstandene er oppfylt. Kvalitetsmålene er
kategorisert etter tema: Metadata, populasjon-enhet og variabler. Vi har i tillegg
sett på hva som skal til for å tilrettelegge et statistikksystem for å kunne lage
kvalitetsmålene. Det viktigste er å ta vare på informasjon som genereres underveis,
fra de ulike prosessene, slik at de i etterkant kan brukes til å beregne kvalitetsmål.
Til slutt presenterer vi en prosessmodell som legger vekt på automatisering,
makroperspektiv, kvalitet og datatilstander. Modellen et sett av prosesser satt i
rekkefølge, der den menneskelige interaksjonen med dataene er skilt klart ut fra det
som kan bli gjort maskinelt. I denne modellen har vi integrert kvalitet i alle
prosesser og produkter som inngår. Dette er en metode for å sikre god kvalitet på
sluttproduktene.