Stordatapolitikk eller politikk for store data? Skatteetatens erfaringer og perspektiver på analyse av store datamengder
Hva er skatteetatens status og behov rundt stordata?
Stordata er ikke bare analyse! Skatteetaten har siden 2010 arbeidet med å endre de tekniske forutsetningene for sitt samfunnsoppdrag. De fremgangsmåter som vi har valgt for å kunne gjøre dette innebære implementering av konsepter som vanligvis assosieres med stordata Grunnlagsdata til forhåndsutfylling av skattemelding for formues- og inntektsskatt (rundt 55 millioner informasjonselementer) 3,8 millioner elektroniske skattemeldinger til privatpersoner 1.2 millioner momsoppgaver 200 000 arbeidsgivere rapporterer månedlig lønns- og inntektsopplysninger om 4.5 millioner inntektsmottakere Samfunnsoppdraget til etaten utløser samtidig et stort analytisk behov som skal sikre at samfunnets og etatens verdikjeder fungerer
What is the problem, to which Big Data is the answer? End of the road for VAT fraudster - 6 July 2011 A VAT fraudster who set up a fake haulage company in his spare bedroom has been jailed for four years. Unemployed "John Doe", 49, submitted false VAT returns that would have entitled his company to 604,179 in VAT repayments. He spent more than 430,000 on luxury goods and to feed his gambling habit while claiming Jobseeker s Allowance and even continued his fraud while in prison for an unrelated offence. "Doe", who was declared bankrupt in 2005, registered his business in 2007. Working from his spare room he created fake invoices, haulage paperwork, insurance documents and fuel receipts to make it look as though he was trading as a legitimate haulier. He claimed to have bought 30 new haulage vehicles and spent around 211,000 on fuel when in fact his company didn t even have a haulage licence. He obtained registration numbers to use on documents by driving past a well-known haulage supplier on the first day of new vehicle registrations and jotting down the numbers as the vehicles were unloaded. Tax officers arrested "Doe" in March 2011 when they discovered his plans to create another company to try to steal even more money using the same scam. During interviews, he admitted he had devised the plan so that he didn t have to get a proper job.
Analytiske behov Behov for å få økt innsikt i risikofaktorer rundt etterlevelsen i skattesystemet Strukturering av data er tidkrevende og byr på kvalitative utfordringer Kildetilrettelegging på store datasett blir formet av de tekniske verktøy etaten besitter. Manuell prosesser og liten automatiseringsgrad hemmer analytisk kapasitet Need to know-prinsippet skal også respekteres internt i virksomheten.
Erfaringer fra Big Insight Produsere avanserte prediktive analysemetoder for å trekke ut kunnskap fra komplekse data og levere god innsikt Kun på interne skattedata, men dette er ikke stordata slik vi vurderer det fordi vi kobler ikke våre data med andre aktører eller fra åpne kilder på internett. Juridiske hindre og praktiske hindre er større og tar lang tid. Spesielt kobling av ulike informasjonselementer for å kunne predikere utløser personsensitive vurderinger
Perspektiver på politikkbehovet Vår vurdering er at en stordata-politikk vil måtte bidra til de behov offentlig sektor i dag opplever som utfordrende: Analytisk kapasitet i form av programvare og maskinvare er kostnadsintensivt og krever mye prioriteringsvilje over lang tid OPS Politiske ønsker om økt deling internt i offentlig sektor og med andre samfunnsaktører kan true tillit og legitimiteten til samfunnsoppdraget til offentlige forvaltningsorganer Tydeliggjøre handlingsrommet for stordata juridisk, teknisk og analytisk