En el Perú estamos por detras de nuestros vecinos en aspectos de ciencia y tecnología. Para demostrarlo suele compararse nuestros indicadores con los de los países vecinos. Un buen ejemplo de eso está en el blog de Modesto Montoya (Perú sin ciencia y tecnología condenado al estancamiento). Para ese tipo de comparaciones buenas fuentes de información son World Bank Development Indicators, RICYT y la UNESCO. A nivel del Perú el INEI y en Banco Central de Reserva son los que proveen varios indicadores.
Si decidimos hacer un recuento histórico de los indicadores la cosa se complica. La información no está disponible en bases de datos en línea y hacer uno mismo las estimaciones puede ser extremadamente tedioso o imposible. Una fuente de información para el Perú que tiene una buena cantidad de datos es Perú ante la sociedad del conocimiento: Indicadores de ciencia, tecnología e innovación 1960 -2002 (Concytec, 2003). Aunque no tiene información sobre los últimos 15 años la información que tiene sobre años anteriores es probablemente la mejor que podrán encontrar. Lamentablemente el compendio no está disponible en línea pero sí en algunas bibliotecas universitarias.
Estos son los datos:
imasd_peru <- read.csv("C:/Users/Lucia/Dropbox/RArch/imasd_peru.csv")
tab<-cbind(Year=imasd_peru[,1],PBI_100miles_soles_2007=imasd_peru[,2],ImasD_100miles_soles_2007=imasd_peru[,6])
head(tab)
## Year PBI_100miles_soles_2007 ImasD_100miles_soles_2007
## [1,] 1970 1168.49 0.1519037
## [2,] 1971 1222.13 NA
## [3,] 1972 1264.63 NA
## [4,] 1973 1344.01 NA
## [5,] 1974 1470.17 NA
## [6,] 1975 1533.40 5.5202400
En el gráfico siguiente puede verse que si se conserva la escala y se comparte el eje y los datos no se visulizan bien, es decir los valores de I+D son tan pequeños frente al PBI que no se pueden ver.
#utilizo el comando plot integrado en el R
#1 grafico el PBI en un gráfico de dispersión
plot(tab[,1],tab[,2],type="l", ylab="PBI en cientos de miles de soles del 2007", xlab="Año", col="blue")
#agrego los puntos correspondientes a I+D pero al ser valores muy pequeños no son visibles en el gráfico
points(cbind(tab[,1],tab[,3]),type="p",col="red",pch=19)
#agrego una "rejilla" al gráfico
grid()
#agrego la leyenda al gráfico
legend("topleft",legend=colnames(tab[,2:3]),lty=c(1,2),col=c("blue","red"),bg="white",lwd=2)
Ante esta situación hay ocasiones en las que se pone el gráfico con dos ejes y, uno a la izquierda y otro a la derecha y cada uno corresponde a la escala de una de las variables. Aunque esa manera de mostrar los datos permite visualizar los elementos de la serie también puede inducir a la confusión pues invisibiliza las diferencias en la escala. Por eso parecía más interesante hacer el gráfico en un solo panel que comparta el eje x pero tenga diferentes ejes y.
En el gráfico a continuación se compara el crecimiento del PBI peruano (en cientos de millones de soles del 2007, data proveniente del Banco Central de Reserva) con la inversión en Investigación y Desarrollo (I+D) como porcentaje del PBI (datos provenientes de Perú ante la sociedad del conocimiento: Indicadores de ciencia, tecnología e innovación 1960 -2002 y de estimaciones de Fernando Romero para Foro Nacional Internacional). Como puede verse los datos comparten el eje x (años) y tienen un diferente eje y (cientos de millos de soles del 2007 para el PBI y porcentaje del PBI para la inversión en I+D).
Para esto se siguio el ejemplo de la wikia de ggplot2 que tiene buenas explicaciones con casos prácticos para el uso de este paquete en R.
#llamo a la librería ggplot2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.2.5
#identifico la variable x
x <- imasd_peru[,1]
#identifico la data para el panel1
d1 <- data.frame(x=x, y=imasd_peru[,2])
#identifico la data para el panel2
d2 <- data.frame(x=x, y=imasd_peru[,5])
#agrego uno columna que identifica el panel en cada uno de los casos
d1$panel <- "PBI"
d2$panel <- "I+D %PBI"
#uno la data de los dos paneles
d <- rbind(d1, d2)
#si en los pasos posteriores surge algún error es bueno hacer un
#summary(d)
#para poder ver si por accidente alguno de los datos se importó como valores cuantitativos en vez de cualitativos (o como R lo llama "factores")
#identifico la data en ggplot y los ejes
p <- ggplot(data = d, mapping = aes(x = x, y = y)) +
#genero dos paneles
facet_grid(panel~., scale="free") +
#genero la línea de PBI
geom_line(data = d1, stat = "identity", color="blue") +
#genero los puntos de I+D
geom_point(data = d2, stat = "identity",color="red", size=2)+
geom_line(linetype="dashed")
p
## Warning: Removed 31 rows containing missing values (geom_point).
Este es sólo un ejemplo de las variables que podrían incluirse. Aún tomando en cuenta la misma data hay algunas transformaciones que podrían tomarse en cuenta como el PBI per cápita o la inversión en I+D en millones de soles en vez de porcentaje. Espero que esta explicación les haya sido de utilidad y gracias por las estimaciones de I+D a Fernando Romero.
Artículos Relacionados
- Perú. Gasto público en educación superior, estimaciones varias
- ¿Quién soy? Un post personal con sunburstR
- ¿Por qué los rankings son engañosos?
- Principales Indicadores Bibliométricos de la Actividad Científica Peruana 2006-2011 ¿Categorías sectoriales?
- Un desafío persistente en la feria del libro Ricardo Palma