Kode
source("Dataimport.R", encoding = "UTF-8") #Kjører eget script for dataimport
FO - Fellesorganisasjonen
Dette dokumentet har som hensikt å gjennomgå tallgrunnlaget FO baserer seg på i sin kommunikasjon rundt likelønnsdagen i 2022. Dokumentet er teknisk og ment å gjøre det mulig å ettergå beregningene som har blitt gjort. Tallene er i hovedsak beregnet for beregnet ut fra SSBs tabell 11418.
Beregningene er gjort i R og kode er lagt ved slik at resultatene kan reproduseres. Se Seksjon 6 for info om kilder og reproduksjon. Det er mulig å se koden som har blitt brukt for å lage figurer og tabeller ved å trykke på nedtrekksmenyene for kode.
source("Dataimport.R", encoding = "UTF-8") #Kjører eget script for dataimport
library(tidyverse)
library(forcats)
library(kableExtra)
library(scales)
library(ggrepel)
library(Hmisc)
library(stats)
## Prosentfunksjon som brukes til formatering i figurer ##
= function(x, digits=1) {
pct sprintf(paste0("%1.",
digits,"f%%"),
*100)
x
}
## Temaer og farger ##
<- theme_get() #Backup av theme
theme_default theme_set(theme_classic())
# Farger #
<- c("#e20523", #Rød
FO_farger "#75c6c5", #Blå
"#00a253", #Grønn
"#644c9a", #lilla
"#ed71a8", #rosa
"#dbc71d" #gul
)
Likelønn er et komplekst tema med mange forskjellige aspekter og innfallingsvinker
Det kan være så konkret som lik lønn for likt arbeid. Det kan være lik lønn for arbeid av lik verdi, eller lik lønn mellom sektorer. FO mener at man må se på alle disse aspektene i likelønndebatten. Likelønnsdagen er en god anledning til å sette fokus på problemet.
FO og andre organisasjoner støtter opp om likelønnsdagen som faller på datoen tilsvarende kvinners lønnsandel av menns i gjennomsnitt. I år faller denne til 17. november. Denne datoen har fått en del kritikk knyttet til at man benytter seg av gjennomsnitt som statistikkmål.
Ulikelønnen blir i de fleste tilfeller målt til å være mindre når man benytter seg av median, men utviklingen og tendensene er i stor grad de samme på tvers av sentralitetsmål.
<- ssb11418_tid_median %>%
last_data_median filter(år == max(år))
<- ssb11418_tid_mean %>%
last_data_mean filter(år == max(år))
<- last_data_median %>%
tojoin select(c("sektor", "Lønnsandel"))
<- last_data_mean %>%
toplot left_join(y = tojoin, by = "sektor") %>%
rename(Gjennomsnitt = "Lønnsandel.x",
Median = "Lønnsandel.y") %>%
pivot_longer(cols = 9:10, names_to = "Statistikkmål")
ggplot(toplot, aes(x = sektor, y = value, fill = Statistikkmål))+
geom_bar(stat = "identity", position = "dodge") +
geom_text(aes(label = pct(value, digits = 1), y = value + 0.05),
position = position_dodge(0.9))+
scale_y_continuous(labels = label_percent())+
scale_x_discrete(guide = guide_axis(n.dodge = 2)) +
labs(title ="Kvinners månedslønn som andel av menns, i prosent",
subtitle = "Sammenligning av statistikkmål",
caption = "Kilde: SSB tabell 11418")+
theme_classic()+
theme(axis.title = element_blank(),
legend.position = "bottom",
legend.title = element_blank()
+
)scale_fill_manual(values = FO_farger)
Gjennomsnitt som sentralitetsmål har svakheten med med at de påvirket av skeivheter i populasjonen. Det gjør at gjennomsnittsmålene for lønn i Norge ikke er særlig representative hva de fleste i landet tjener. Hvis man ønsker å gi et sentralitetsmål som treffer dette er median det mest egnede sentralitetsmålet.
Gjennomsnitt er sentralitetsmålet flest i landet har et forhold til og forstår. Gjennomsnittet sin svakhet er at det ikke justerer for skeivhet, men her også noe av målets styrke i denne sammenheng da den tar med seg lønnsforskjellene på blant de høyeste lønnede i befolkningen, og ulikelønn i landet som helhet. Se forøvrig SSBs istribusjonsfordeling1 av inntekter på kjønn.
Det er slik at ulikelønnen er høyere ved bruk av gjennomsnitt enn med median. Men de store linjene og utviklingen er mer eller mindre de samme. Vi mener derfor at gjennomsnitt likevel kan brukes for å kommunisere rundt problematikken.
Gjennomsnitt er et mer kjent sentralitetsmål enn median
Trend og utvikling i stor grad lik for begge sentralitetsmål
God indikator på ulikelønnsproblemer i lønnsdannelsen som helhet
Figur 2 og Figur 3 viser at det er en positivt utvikling i samfunnet. Ulikelønnen synker over tid både med bruk av gjennomsnitt og median. Men utviklingen går sakte.
<- ssb11418_tid_mean %>%
last_data_mean filter(år == max(år))
<- ggplot(ssb11418_tid_mean, aes(x = år, y = Lønnsandel, colour = sektor)) +
plot_mean geom_line(stat = "identity", size = 2) +
scale_y_continuous(limits = c(0.82, 0.98) ,labels = scales::percent_format(sacle = 1))+
scale_x_date(breaks = date_breaks("1 year"), labels = date_format("%Y"))+
geom_text_repel(aes(label = pct(Lønnsandel, 1)),
data = last_data_mean,
show.legend = FALSE) +
labs(title = "Utvikling i kvinners månedslønn som andel av menns, i prosent",
subtitle = "Gjennomsnitt, alle stillinger",
caption = "Kilde: SSB tabell 11418") +
theme(legend.position = "bottom",
legend.title = element_blank(),
axis.title.x = element_blank())+
scale_color_manual(values = FO_farger)+
rm(last_data_mean)
plot_mean
<- ssb11418_tid_median %>%
last_data_median filter(år == max(år)) #%>%
#mutate(Lønnsandel = paste0(round(Lønnsandel * 100, 1), '%'))
<- ggplot(ssb11418_tid_median, aes(x = år, y = Lønnsandel, colour = sektor)) +
plot_median geom_line(stat = "identity", size = 2) +
scale_y_continuous(limits = c(0.82, 0.98), labels = scales::percent_format(sacle = 1))+
scale_x_date(breaks = date_breaks("1 year"), labels = date_format("%Y"))+
geom_text_repel(aes(label = pct(Lønnsandel, 1)),
data = last_data_median,
show.legend = FALSE) +
labs(title = "Utvikling i kvinners månedslønn som andel av menns, i prosent",
subtitle = "Median, alle stillinger",
caption = "Kilde: SSB tabell 11418")+
theme(legend.position = "bottom",
legend.title = element_blank(),
axis.title.x = element_blank())+
scale_color_manual(values = FO_farger)
rm(last_data_median)
plot_median
Det er store sektorforskjeller. Det er mye høyere grad av likelønn i kommunal sektor enn i øvrige sektorer.
Hvis man sammenligner de to statistikkmålene ser man at “Privat sektor” og “Sum alle sektorer” avviker i større grad en i offentlig sektor. Dette skyldes av at det er et større lønnspenn med flere veldig høyt lønnede stillinger enn i offentlig sektor, men disse er også mannsdominerte.
I STYRK-08 har vi identifisert Sosialarbeiderne i følgende yrkesgrupper. Vernepleiere, Rådgivere innen sosiale fagfelt, Miljøarbeidere innen sosiale fagfelt og saksbehandlere innen sosiale ytelser. Dette er så presist en kommer innenfor STYRK-08 4-sifferskoder.
<- c("3353","3412","2224","2635")
yrkesgrupper
<- clean_wide %>%
toplot filter(Kode %in% yrkesgrupper) %>%
transmute(
kode = Kode,
Yrke = Yrke,
Sektor = sektor,
Differanse = `Gjennomsnittslønn - Kvinner` - `Gjennomsnittslønn - Menn`,
'Begge kjønn' = Gjennomsnittslønn,
Kvinne = `Gjennomsnittslønn - Kvinner`,
Mann = `Gjennomsnittslønn - Menn`) %>%
pivot_longer(cols = 5:7, names_to ="Kjønn") %>%
filter(Kjønn != "Begge kjønn") %>%
arrange(Differanse)
<- toplot %>%
plot filter(Sektor == "Sum alle sektorer") %>%
mutate(Yrke = fct_reorder(Yrke, Differanse, .desc = TRUE)) %>%
ggplot(aes(y = Yrke, x = value))+
geom_line(aes(group = Yrke), size = 2)+
geom_point(aes(colour = Kjønn), size =5) +
labs(title = "Lønnsforskjeller mellom kvinner og menn blant sosialarbeiderstillinger",
x = "Gjennomsnittlig månedslønn i NOK",
y = element_blank(),
caption = "Kilde: SSB tabell 11418")+
theme_minimal()+
theme(legend.title = element_blank(),
legend.position = "bottom",
axis.line = element_line(size = 0.5),
axis.ticks = element_line(size = 0.5))+
scale_color_manual(values = FO_farger)
plot
%>%
toplot arrange(desc(Sektor)) %>%
kbl() %>%
kable_paper()
kode | Yrke | Sektor | Differanse | Kjønn | value |
---|---|---|---|---|---|
2224 | Vernepleiere | Sum alle sektorer | -1580 | Kvinne | 47270 |
2224 | Vernepleiere | Sum alle sektorer | -1580 | Mann | 48850 |
2635 | Rådgivere innen sosiale fagfelt | Sum alle sektorer | -1400 | Kvinne | 46570 |
2635 | Rådgivere innen sosiale fagfelt | Sum alle sektorer | -1400 | Mann | 47970 |
3412 | Miljøarbeidere innen sosiale fagfelt | Sum alle sektorer | -860 | Kvinne | 44390 |
3412 | Miljøarbeidere innen sosiale fagfelt | Sum alle sektorer | -860 | Mann | 45250 |
3353 | Saksbehandlere innen sosiale ytelser | Sum alle sektorer | -460 | Kvinne | 41380 |
3353 | Saksbehandlere innen sosiale ytelser | Sum alle sektorer | -460 | Mann | 41840 |
3412 | Miljøarbeidere innen sosiale fagfelt | Statsforvaltningen | -2740 | Kvinne | 45630 |
3412 | Miljøarbeidere innen sosiale fagfelt | Statsforvaltningen | -2740 | Mann | 48370 |
2224 | Vernepleiere | Statsforvaltningen | -2300 | Kvinne | 48180 |
2224 | Vernepleiere | Statsforvaltningen | -2300 | Mann | 50480 |
2635 | Rådgivere innen sosiale fagfelt | Statsforvaltningen | -1270 | Kvinne | 48890 |
2635 | Rådgivere innen sosiale fagfelt | Statsforvaltningen | -1270 | Mann | 50160 |
3353 | Saksbehandlere innen sosiale ytelser | Statsforvaltningen | -330 | Kvinne | 40990 |
3353 | Saksbehandlere innen sosiale ytelser | Statsforvaltningen | -330 | Mann | 41320 |
3353 | Saksbehandlere innen sosiale ytelser | Privat sektor og offentlige eide foretak | -1410 | Kvinne | 44200 |
3353 | Saksbehandlere innen sosiale ytelser | Privat sektor og offentlige eide foretak | -1410 | Mann | 45610 |
2224 | Vernepleiere | Privat sektor og offentlige eide foretak | -750 | Kvinne | 46970 |
2224 | Vernepleiere | Privat sektor og offentlige eide foretak | -750 | Mann | 47720 |
2635 | Rådgivere innen sosiale fagfelt | Privat sektor og offentlige eide foretak | -620 | Kvinne | 47420 |
2635 | Rådgivere innen sosiale fagfelt | Privat sektor og offentlige eide foretak | -620 | Mann | 48040 |
3412 | Miljøarbeidere innen sosiale fagfelt | Privat sektor og offentlige eide foretak | -250 | Kvinne | 44090 |
3412 | Miljøarbeidere innen sosiale fagfelt | Privat sektor og offentlige eide foretak | -250 | Mann | 44340 |
2224 | Vernepleiere | Kommuneforvaltningen | -1470 | Kvinne | 47140 |
2224 | Vernepleiere | Kommuneforvaltningen | -1470 | Mann | 48610 |
2635 | Rådgivere innen sosiale fagfelt | Kommuneforvaltningen | -1340 | Kvinne | 45910 |
2635 | Rådgivere innen sosiale fagfelt | Kommuneforvaltningen | -1340 | Mann | 47250 |
3412 | Miljøarbeidere innen sosiale fagfelt | Kommuneforvaltningen | -880 | Kvinne | 44250 |
3412 | Miljøarbeidere innen sosiale fagfelt | Kommuneforvaltningen | -880 | Mann | 45130 |
3353 | Saksbehandlere innen sosiale ytelser | Kommuneforvaltningen | NA | Kvinne | 43870 |
3353 | Saksbehandlere innen sosiale ytelser | Kommuneforvaltningen | NA | Mann | NA |
Figur 4 viser at det i samtlige av rapportere sosialarbeideryrker er ulikelønn i kvinnens disfavør. De er ikke store sammenlignet med andre yrker, men eksisterer likevel. Det er noe variasjon mellom sektorene, men trenden er stort sett den samme. Tabell 1 i tab over.
Lønnsforskjellene kan ha en rekke mulige forklaringer. FO viser til Core-rapporten hvor en gjennom statistik analyse peker på lønnsforskjeller mellom kjønnene som de ikke har greid å finne forklarende variabler på.2
SSB har en god oversikt og visualisering av lønnsforskjeller på stillingsnivå med mulighet for å bytte melllom ønskede variabler.
FOs budskap for årets likelønndags handler om ulikelønn mellom grupper og sektorer som FO mener er sammenlignbare.
her sammenligner vi gjennomsnittlig månedslønn for alle, uavhengig av kjønn. Vi har undersøkt om det er sammenheng mellom kvinneandel og lønnsnivå, og mener det er grunnlag for å si at det er en statistisk sammenheng mellom kvinneandel og lønnsnivå blant yrker med høyere utdanning. Se Seksjon 5.1 og Figur 7.
Vi har valgt å fokusere på sosialarbeidere og sammenligner dem med ingeniøryrker. Vi har begrenset det til et utvalg vi mener kan sammenlignes med sosialarbeidere knyttet til utdanningsnivå og ansvar.
<- c("3353", "3412","2224", "3115", "3112", "3114", "2635", "3119")
yrkesgrupper_sammenligning
<- clean_wide %>%
toplot filter(sektor == "Sum alle sektorer",
%in% yrkesgrupper_sammenligning)
Kode
<- toplot %>%
plot mutate(Yrke = fct_reorder(Yrke, Gjennomsnittslønn),
Gruppe = ifelse(`Yrke 3-siffernviå` =="Ingeniører", `Yrke 3-siffernviå`, "Sosiale yrker")) %>%
ggplot(aes(x = Yrke, y = Gjennomsnittslønn, fill = Gruppe)) +
geom_bar(stat = "identity")
+ coord_flip() +
plot theme_classic()+
theme(legend.position = "bottom",
legend.title = element_blank())+
labs(title = "Gjennomsnittlig månedslønn i ulike stillinger",
subtitle = "Sum alle sektorer",
x = element_blank(),
y = "Gjennomsnittlig månedslønn i NOK",
caption = "Kilde: SSB tabell 11418")+
scale_fill_manual(values = c("#75c6c5", "#e20523"))
<- clean_wide %>%
toplot filter(Kode %in% yrkesgrupper_sammenligning) %>%
mutate(Yrke = fct_reorder(Yrke, Gjennomsnittslønn),
Gruppe = ifelse(`Yrke 3-siffernviå` =="Ingeniører", `Yrke 3-siffernviå`, "Sosiale yrker"))
<- toplot %>%
plot ggplot(aes(x = Yrke, y = Gjennomsnittslønn, fill = Gruppe)) +
geom_bar(stat = "identity")+
facet_wrap(~sektor)
+ coord_flip() +
plot theme_classic() +
theme(legend.position = "bottom",
legend.title = element_blank())+
labs(title = "Gjennomsnittlig månedslønn i ulike stillinger",
x = element_blank(),
y = "Gjennomsnittlig månedslønn i NOK",
caption = "Kilde: SSB tabell 11418")+
scale_fill_manual(values = c("#75c6c5", "#e20523"))
library(DT)
%>%
toplot select(1,2,5,6,13,16) %>%
datatable(filter = "top",
)
Som man ser i Figur 5 og Figur 6 er det et høyere lønnsnivå blant ingeniøryrkene enn sosialarbeideryrkene. Her er det variasjoner mellom sektoreren. Statsforvaltnignen skiller seg positivt ut og det er ganske likt lønnsnivå med unntak av saksbehandlere og elektroingeniører. Lønnsforskjellene er størst i privat sektor, og det er mangelfulle tall for full sammenligning i kommuneforvaltnignen. Se nøyaktige beløp samt kvinneandel for yrkene i egen tab.
Vi har begrenset datasettet til å gjelde for “Sum alle sektorer”. Dette kommer av begrensinger i datakvaliteten da SSB ikke oppgir kjønn på en del stillinger av konfidensialitetshensyn. Dette betyr også at mange av de ytterlige observasjonene forsvinner. Dette kan påvirke forklaringskraften i modellen. Det er også slik at det er mange flere stillinger i det private enn i offentlig sektor, det gjør også at det er færre observasjoner blant offentlig sektor som trekker ned frihetsgrader i analysen. Det er også en del svakheter med selve STYRK-08 klassifiseringen hvor enkelte yrker uten krav til høyere utdanning faller inn under styrk-kategoriene for 2 og 3. Se kapittel om datagrunnlag.
Vi gjør en tilpassing av tabellen for å begrense til yrkeskategorier og sektor
<- clean_wide %>%
analyse filter(str_detect(Kode, "^2|^3"),
!= "Sum alle sektorer") # Begrenser utvalget til stillnger innenfor STRYK-klassifiseringen Akademiske sektor
<- analyse %>%
fig ggplot(aes(x = Kvinneandel, y = Gjennomsnittslønn)) +
geom_point(alpha = 0.3)+
geom_smooth(method = "lm", colour = "#e20523")+
scale_x_continuous(labels = percent_format())+
scale_y_continuous(labels = scales::label_number())+
theme(legend.position = "bottom",
legend.title = element_blank())+
labs(title = "Forholdet mellom kvinneandel og månedslønn",
subtitle = "Akademiske- og høyskoleyrker - Sum alle sektorer",
y = "Gjennomsnittlig månedslønn i NOK",
x = "Kvinneandel i prosent",
caption = "Kilde: SSB tabell 11418")+
scale_color_manual(values = FO_farger)
fig
<- lm(formula = Gjennomsnittslønn ~ Kvinneandel, data = analyse)
results summary(results)
Call:
lm(formula = Gjennomsnittslønn ~ Kvinneandel, data = analyse)
Residuals:
Min 1Q Median 3Q Max
-21711 -6428 -2712 4831 47472
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 68650 2156 31.840 < 2e-16 ***
Kvinneandel -22671 3808 -5.954 1.37e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 11260 on 177 degrees of freedom
(325 observations deleted due to missingness)
Multiple R-squared: 0.1669, Adjusted R-squared: 0.1622
F-statistic: 35.45 on 1 and 177 DF, p-value: 1.373e-08
Vi kan visualisere forholdet mellom kvinneandel og gjennomsnittlig månedslønn. På Figur 7 er hvert yrke i utvalget representert med en prikk. En ser at det er noen høytlønnede yrker som skiller seg litt ut fra mengden, men at trenden er at prikkene synker på lønn jo høyere kvinneandel er.
Dette forholder er illustrert med den røde linjen som er basert på en lineær regresjon, og viser at det er en signifikant sammenheng. (Se P-verdier i egen fane).
Så hva betyr dette? Det betyr at det er et statistisk grunnlag for å si at det er høyere lønn i yrker med lavere kvinneandel.
Det kan være en rekke grunner til dette forholdet. Alder, Utdanningsvalg/nivå, Det er ikke mulig å sammenstille dataen for å kontrollere for disse variablene, men det er naturlig å anta at disse vil kunne sammenfalle mer eller mindre med funnet i figuren.
FO mener likevel at en rekke av disse andre forklarende variablene har en kjønnsdimensjon, og at disse også må tas med i likelønndebatten.
I analysen har vi benyttet oss av SSB sin tabell 11418: Yrkesfordelt månedslønn, etter sektor, kjønn og arbeidstid fra 2015 - 2021. Datagrunnlaget kommer fra innrapportert lønn fra A-ordningen.
Vi bruker STYRK-08 klassifiseringen. Når vi sammenligner grupper har vi avgrenset til yrker gruppert på 2 og 3 nivå for å få en hensiktsmessig sammenligning. Denne klassifiseringen har en noen svakheter med seg som at en del yrker burde ikke vært under “Høyskoleyrker”.VI har likevel valgt å en etablerte klassifiseringsmetode gjennom SSB fremfor å utvikle vår egen klassifiseringsmetode.
Dere kan laste ned rå tabellen som brukes for resten av beregningene her. NB. Dette er ment for reproduksjon av våre resultater. Skal du gjøre egne beregninger bør du hente data fra SSB selv. Noen figurer er basert på tidsserie og er importert og behandlet som egne tabeller. Se koden i “Dataimport.R”