El paquete ismtchile
fue creado con el fin de facilitar
el cálculo y distribución del Índice Socio Material Territorial,
indicador creado por el Observatorio de Ciudades UC. La
elaboración del ISMT se realizó tomando en cuenta 4 índices
socio-materiales con especificidad territorial, rescatados del censo
2017 mediante RStudio. Estos son los índices de escolaridad del jefe de
hogar, la materialidad de la vivienda, el hacinamiento y el
allegamiento.
El índice de escolaridad se calculó tomando en cuenta 7 niveles de escolaridad alcanzado por el jefe de hogar:
Estos niveles de escolaridad fueron complementados con información
del censo que hace referencia a si se completó o no el nivel educacional
previamente declarado (variables p14
y
p15
).
Los puntajes ponderados de los 7 niveles de escolaridad se calcularon considerando el porcentaje de cada nivel dentro de cada zona censal (con respecto al total de casos). Este porcentaje de representación de la variable fue multiplicado por un puntaje de entre 1 (nivel de escolaridad bajo) y 1000 (nivel de escolaridad alto) para cada una de las zonas
El puntaje ponderado de la escolaridad básica se suma a los puntajes ponderados de los demás niveles educacionales para generar una suma ponderada de la escolaridad del jefe de hogar en la zona censal. Este puntaje va de 1 a 1000.
El índice de calidad de la vivienda se calculó tomando en consideración los parámetros definidos por el Ministerio de Desarrollo Social (MDS). De acuerdo con este índice, se consideraron 3 dimensiones a evaluar en las viviendas ocupadas: paredes exteriores, techo y piso. Estas condiciones se evalúan y resultan en un índice de la vivienda basado en aquellas que son:
A continuación, se clasificó a las viviendas de acuerdo a un índice, tomando en consideración las categorías de Aceptable, Recuperable e Irrecuperable, determinadas de acuerdo a las siguientes condiciones:
El índice de hacinamiento se realizó considerando la metodología del Ministerio de Desarrollo Social (MDS), el cual estipula el hacinamiento como la razón entre el número de personas residentes en la vivienda y el número de dormitorios de la misma. Este cálculo considera aquellos dormitorios de uso exclusivo o múltiple, y determina las categorías sin hacinamiento, hacinamiento medio y hacinamiento crítico, considerando los siguientes puntajes como referencia:
El cálculo del allegamiento se establece de manera simple y directa considerando la cantidad de hogares por vivienda.
El índice compuesto de materialidad territorial se calcula con respecto al número de casos, ya sean de personas o viviendas por zona censal, e incluye:
Los puntajes ponderados de los 7 niveles de escolaridad se calcularon considerando el porcentaje de cada nivel dentro de cada zona censal (con respecto al total de casos). Este porcentaje de representación de la variable fue multiplicado por un puntaje de entre 1 (nivel de escolaridad bajo) y 1000 (nivel de escolaridad alto) para cada una de las zonas.
El puntaje ponderado de la escolaridad básica se suma a los puntajes ponderados de los demás niveles educacionales para generar una suma ponderada de la escolaridad del jefe de hogar en la zona censal. Este puntaje va de 1 a 1000.
Los puntajes ponderados de las categorías de calidad de la vivienda fueron calculados considerando el porcentaje que cada categoría representaba en cada zona censal. Los porcentajes de representación de estas categorías fueron multiplicados por un puntaje dado de entre 1 y 1000 (1: viviendas irrecuperables y 1000: viviendas aceptables). El resultado de estos puntajes ponderados fue sumado para determinar el índice de calidad de la vivienda para la zona censal estudiada. Este puntaje va de 1 a 1000.
Así como en ambos casos anteriores, las tres categorías de hacinamiento fueron calculadas por zona censal, ponderándose puntajes de entre 1 para aquellas viviendas con hacinamiento crítico, y 1000 para aquellas sin hacinamiento. Luego de realizadas las ponderaciones, el puntaje final de hacinamiento va desde 1 a 1000.
Así como en ambos casos anteriores, las categorías de allegamiento fueron calculadas por zona censal, ponderándose puntajes de entre 1 para aquellas viviendas con dos núcleos y 1000 para el valor máximo de allegamiento posible por la unidad territorial (ciudad o región) en donde se calcule.
Para relacionar estas variables y entender la significancia de cada una en sí misma, se realizó cálculo de componentes principales el cual busca el peso de cada una de las variables en función de la región (cada región tiene su propio PCA) y dentro de cada región se establece la separación entre territorios rurales y urbanos (tomando en consideración la clasificación del INE).
Luego de finalizada esta prueba mediante el análisis PCA, los puntajes finales fueron ponderados por la discriminación arrojada para generar una nueva suma ponderada de las cuatro variables con sus nuevos pesos.
Los resultados por zona luego fueron normalizados entre 0 y 1 para representar el nuevo índice de materialidad territorial por zona censal.
Una vez obtenido el puntaje continuo, se procede a clasificar el ISMT a través de la percentilización del mismo. Este se realiza considerando tres clasificaciones:
Región | AB | C1a | C1b | C2 | C3 | D | E |
---|---|---|---|---|---|---|---|
1 | 1.3 | 6.6 | 6.9 | 13.7 | 30 | 33.2 | 8.3 |
2 | 1.7 | 6.8 | 7.8 | 19.5 | 33.8 | 25.4 | 5 |
3 | 0.9 | 5.3 | 5.6 | 12.7 | 33.1 | 34.7 | 7.6 |
4 | 0.3 | 3.2 | 4.6 | 9.8 | 24.9 | 42.4 | 14.7 |
5 | 0.9 | 5.6 | 6.5 | 12.1 | 26.8 | 37.1 | 11.1 |
6 | 0.4 | 3.3 | 4.5 | 9.9 | 23.7 | 41.7 | 16.5 |
7 | 0.4 | 2.4 | 3.9 | 7.4 | 19.8 | 44.5 | 21.5 |
8 | 0.7 | 3.8 | 5.3 | 9.4 | 21.9 | 42.2 | 16.7 |
9 | 0.5 | 3.5 | 4.2 | 7.8 | 18.8 | 42.6 | 22.5 |
10 | 0.6 | 4 | 4.8 | 8.9 | 21.5 | 44.6 | 15.6 |
11 | 1.2 | 7.6 | 7.3 | 12.8 | 27.8 | 36 | 7.1 |
12 | 1.6 | 7.1 | 8.4 | 17.2 | 34.8 | 27 | 3.9 |
13 | 3.6 | 9 | 8.1 | 13.7 | 27.2 | 30.6 | 7.8 |
14 | 0.8 | 4.5 | 5 | 8.6 | 21.4 | 41.7 | 17.9 |
15 | 0.5 | 4.6 | 6 | 11.7 | 29.2 | 38.3 | 9.7 |
16 | 0.3 | 2.9 | 4.2 | 7.4 | 19 | 42.5 | 23.7 |
Chile | 1.8 | 6 | 6.3 | 11.2 | 24.7 | 36 | 14 |
Las variables descritas anteriormente corresponden a las variables
del censo 2017. Para las versiones 2.x.x
y superiores, se
realizó una homologación de las variables censales de 1982, 1992, 2002,
2012 y 2017 a través de la literalización de los factores. Si bien
ralentiza ligeramente el proceso de cálculo, provee la posibilidad de
trabajar de forma transversal con los distintos años. La descarga de la
data del 2017 está disponible en la página del ISMT, así como la
metadata de la literalización.
El flujo de trabajo del paquete está pensado de forma de evidenciar los mayores pasos a seguir en el cálculo del indicador, en el siguiente orden:
# install.packages('ismtchile')
library(ismtchile)
data(c17_example)
ismt <- c17_example |>
literalize(2017) |>
cleanup() |>
precalc() |>
get_pca() |>
ismt_scores(10, 2017) |>
namify('ine17', 'c')
ismt <- c17_example |> full_ismt()
The R package ismtchile
was created to fecilitate the
calculation and distribution of the Socio Material Territorial Indicator
(ISMT), an indicator created by Observatorio de Ciudades UC. The
ISMT was created based on 4 socio-material indices with territorial
specificity. These indices are the scholarity of the head of household,
the materials of the dwelling, overcrowding and number of households
within the same dwelling.
This indicator was calculated with 7 levels in mind:
These scholarity levels have been calculated with census information
referencing to completion of the specified scholarity level (variables
p14
and p15
).
The weighted scores for the 7 levels were calculated considering the percentage of each level within the zone, with respect to the total amount of observations.This variable representation percentage was multiplied by a score between 1 (low scholarity level) and 1000 (high scholarity level) for each zone.
The weighted score for primary scholarity is added to the other levels in order to generate a weighted sum of for the scholarity of the head of household within the zone. This score goes from 1 to 1000.
The dwelling quality indicator was calculated based on parameters as defined by the Ministry of Social Development (MDS). According to the indicator, 3 dimensions were taken into consideration in order to evaluate the occupied dwellings: exterior walls, roofing and floors. These conditions are then evaluated and result in an indicator for dwelling quality based on the following categories:
After this, the dwellings were classified according to the indicator, considering the Acceptable, Retrievable and Irretrievable categories, determined by the following conditons:
The overcrowding indicator was made in consideration of the methodology as defined by the Ministry of Social Development (MDS), which stipulates overcrowding as the rate of persons residing in a dwelling and the number of bedrooms in it. This calculation takes into consideration rooms with exclusive/multi-purpose use as a bedroom, and determines the Critical overcrowding, Medium overcrwoding and No overcrowding categories.
The composite IMT is calculated relative to the number of observations, either persons or dwellings within the zone. It includes:
The weighted scores for the 7 levels of scholarity were calculated takeing into consideration the percentage of each level within the zone (relative to the total number of observations). This percentage was multiplied by a score between 1 (low scholarity) and 1000 (high scholarity) for each zone.
The weighted scores for the dwelling quality categories were calculated considering the percentage that each category represents within each zone. The percentage of representation for each categorywere multiplied by a score between 1 (irretrievable dwellings) and 1000 (acceptable dwellings). The result of these weighted scores were added to form the quality of dwelling indicator for each zone. This score spans values between 1 and 1000.
Just like in the previous cases, the 3 categories for overcrowding were calculated considering the percentage that each one represents within its zone. The scores are also weighted with scores between 1 (critical overcrowding) and 1000 (no overcrowding).
Just like in the previous cases,the categories for this indicator were calculated by weighing scores between 1 (dwellings with 2 households) and 1000 (for the maximum possible value) for each zone.
In order to relate these variables and understand the significance of each of them on their own, a principal components analysis calculation was applied, looking for each of the variable’s weight. Each region has its own PCA, and the separation of urban and rural areas within the region is established, per INE classification.
Once the continuous score is obtained, the ISMT is classified through its percentiles. This is done by considering 2 methods:
Region | AB | C1a | C1b | C2 | C3 | D | E |
---|---|---|---|---|---|---|---|
1 | 1.3 | 6.6 | 6.9 | 13.7 | 30 | 33.2 | 8.3 |
2 | 1.7 | 6.8 | 7.8 | 19.5 | 33.8 | 25.4 | 5 |
3 | 0.9 | 5.3 | 5.6 | 12.7 | 33.1 | 34.7 | 7.6 |
4 | 0.3 | 3.2 | 4.6 | 9.8 | 24.9 | 42.4 | 14.7 |
5 | 0.9 | 5.6 | 6.5 | 12.1 | 26.8 | 37.1 | 11.1 |
6 | 0.4 | 3.3 | 4.5 | 9.9 | 23.7 | 41.7 | 16.5 |
7 | 0.4 | 2.4 | 3.9 | 7.4 | 19.8 | 44.5 | 21.5 |
8 | 0.7 | 3.8 | 5.3 | 9.4 | 21.9 | 42.2 | 16.7 |
9 | 0.5 | 3.5 | 4.2 | 7.8 | 18.8 | 42.6 | 22.5 |
10 | 0.6 | 4 | 4.8 | 8.9 | 21.5 | 44.6 | 15.6 |
11 | 1.2 | 7.6 | 7.3 | 12.8 | 27.8 | 36 | 7.1 |
12 | 1.6 | 7.1 | 8.4 | 17.2 | 34.8 | 27 | 3.9 |
13 | 3.6 | 9 | 8.1 | 13.7 | 27.2 | 30.6 | 7.8 |
14 | 0.8 | 4.5 | 5 | 8.6 | 21.4 | 41.7 | 17.9 |
15 | 0.5 | 4.6 | 6 | 11.7 | 29.2 | 38.3 | 9.7 |
16 | 0.3 | 2.9 | 4.2 | 7.4 | 19 | 42.5 | 23.7 |
Chile | 1.8 | 6 | 6.3 | 11.2 | 24.7 | 36 | 14 |
Las variables descritas anteriormente corresponden a las variables
del censo 2017. Para las versiones 2.x.x
y superiores, se
realizó una homologación de las variables censales de 1982, 1992, 2002,
2012 y 2017 a través de la literalización de los factores. Si bien
ralentiza ligeramente el proceso de cálculo, provee la posibilidad de
trabajar de forma transversal con los distintos años. La descarga de la
data del 2017 está disponible en la página del ISMT, así como la
metadata de la literalización.
The previously described variables come from the 2017 Chilean census.
For versions 2.x.x
and later, variables from the 1982,
1992, 2002, 2012 and 2017 are homologated through factor literalization.
It does make the process slightly slower, but it does provide the
possibility of working seamlessly with the different datasets. Data
download and metadata are available in the ISMT website.
The workflow has been though out show as many steps in the calculation as possible, in the following order:
# install.packages('ismtchile')
library(ismtchile)
data(c17_example)
ismt <- c17_example |>
literalize(2017) |>
cleanup() |>
precalc() |>
get_pca() |>
ismt_scores(10, 2017) |>
namify('ine17', 'c')
ismt <- c17_example |> full_ismt()