Basierend auf meinem kürzlich erschienenen Beitrag zum OECD-Paket in R poste ich hier eine weitere OECD Transportdatenanalyse. Ich analysiere die deutsche Transportvolumenentwicklung indem ich verschiedene Binnenfrachtkategorien in einem ggplot-Diagramm vergleiche. Die Daten habe ich wieder mit dem OECD-Paket in R abgefragt.
library(OECD)
Aus dem vorherigen Beitrag kennen wir bereits den ID-Schlüssel des interessierenden transportbezogenen Datensatzes. Mit get_dataset (R-Funktion aus der OECD-Datenbank) ziehe ich die Daten über die OECD-Schnittstelle in R .
data_df <- as.data.frame(get_dataset(dataset = "ITF_GOODS_TRANSPORT"))
Mit dplyr filtere ich die interessierenden Dateneinträge heraus:
library(dplyr)
colnames(data_df) <- c("country","variable","timeformat","unit","powercode","obsTime","obsValue","obsStatus")
data_df <- dplyr::filter(data_df,country=="DEU")
data_df <- dplyr::filter(data_df,timeformat=="P1Y")
data_df <- dplyr::filter(data_df,unit=="TONNEKM")
data_df <- data_df[is.na(data_df$obsStatus),]
Nach dem Filtern werden die Einträge noch durch Variablenindikatoren unterschieden. Damit ich diese interpretieren kann, ziehe ich die Datenstruktur mit der Funktion get_data_structure aus dem OECD-Paket in R :
data_struct <- get_data_structure("ITF_GOODS_TRANSPORT")
data_struct$VARIABLE
## id label
## 1 T-GOODS-TOT-INLD Total inland freight transport
## 2 T-GOODS-RL-TOT Rail freight transport
## 3 T-GOODS-RD-TOT Road freight transport
## 4 T-GOODS-RD-REW Road freight transport for hire and reward
## 5 T-GOODS-RD-OWN Road freight transport on own account
## 6 T-GOODS-IW-TOT Inland waterways freight transport
## 7 T-GOODS-PP-TOT Pipelines transport
## 8 T-SEA-CAB Coastal shipping (national transport)
## 9 T-SEA Maritime transport
## 10 T-CONT-RL-TEU Rail containers transport (TEU)
## 11 T-CONT Containers transport
## 12 T-CONT-RL-TON Rail containers transport (weight)
## 13 T-CONT-SEA-TEU Maritime containers transport (TEU)
## 14 T-CONT-SEA-TON Maritime containers transport (weight)
Ich kann jetzt ein ggplot-Pfaddiagramm erstellen und die folgenden für mich interessanten Kategorien vergleichen: – Binnenschifffahrt – Binnenschifffahrt – Binnenschifffahrt – Binnenschifffahrt
library(ggplot2)
ggplot(data_df[data_df$variable == c("T-GOODS-IW-TOT",
"T-GOODS-RD-TOT",
"T-GOODS-RL-TOT"),]) +
geom_path(mapping = aes(x=as.numeric(obsTime),y=obsValue, color=variable)) +
ggtitle("German inland freight development by considered category") +
xlab("year") +
ylab("in millions of TONNEKM")
Wirtschaftsingenieur mit Interesse an Optimierung, Simulation und mathematischer Modellierung in R, SQL, VBA und Python
Leave a Reply