Se busca procesar los datos de los árboles de dos ciudades: Ciudad Autónoma de Buenos Aires, Argentina 🇦🇷 y Vancouver, British Columbia, Canadá 🇨🇦. Ambos datos son extraídos de los respectivos portales de gobierno en formato CSV (https://data.buenosaires.gob.ar/dataset/arbolado-publico-lineal/archivo/ecf38a47-563f-42c1-9bd4-7cedf35d536b y https://opendata.vancouver.ca/explore/dataset/street-trees). Si bien se detalla el origen de los archivos, los mismos fueron modificados para simplificar su procesamiento.
Esta implementación funciona también para procesar los datos de árboles de cualquier otra ciudad, manteniendo siempre la estructura de los archivos que se presenta a continuación.
El programa consiste en dos ejecutables distintos, uno para cada dataset. Cada ejecutable lee dos archivos CSV: uno con la información de los árboles correspondientes a una ciudad y otro archivo con la información de los barrios de esa ciudad. En ambos el delimitador es un punto y coma (“;”). Se asume que el formato y contenido de los archivos es correcto.
❖ Cantidad de líneas: 370.089 (incluyendo el encabezado)
❖ Campos Relevantes:
● comuna : Nombre del barrio donde se encuentra el árbol.
● calle_nombre : Nombre de la calle donde se encuentra el árbol
● nombre_cientifico : Nombre científico del árbol
● diametro_altura_pecho : Diámetro del árbol a la altura del pecho
El archivo se compone de una primera línea de encabezado, con los títulos de cada campo. De la segunda línea en adelante, cada línea representa un árbol conteniendo los datos de cada uno de los campos, separados por “;”.
❖ Cantidad de líneas: 16 (incluyendo el encabezado)
❖ Campos:
● nombre : Nombre del barrio, para relacionarlo con el campo "comuna" de arbolesBUE.csv.
● habitantes : Cantidad de habitantes del barrio.
El archivo se compone de una primera línea de encabezado. De la segunda línea en adelante, cada línea representa un barrio.
❖ Cantidad de líneas: 146.746 (incluyendo el encabezado)
❖ Campos Relevantes:
● NEIGHBOURHOOD_NAME : Nombre del barrio donde se encuentra el árbol.
● STD_STREET : Nombre de la calle donde se encuentra el árbol
● COMMON_NAME : Nombre científico del árbol
● DIAMETER : Diámetro del árbol a la altura del pecho
El archivo se compone de una primera línea de encabezado, con los títulos de cada campo. De la segunda línea en adelante, cada línea representa un árbol conteniendo los datos de cada uno de los campos, separados por “,”.
❖ Cantidad de líneas: 23 (incluyendo el encabezado)
❖ Campos:
● nombre : Nombre del barrio, para relacionarlo con el campo "NEIGHBOURHOOD_NAME" de arbolesVAN.csv.
● habitantes : Cantidad de habitantes del barrio.
El archivo se compone de una primera línea de encabezado. De la segunda línea en adelante, cada línea representa un barrio.
Una vez recibido correctamente los path de los archivos CSV, el programa resuelve las consultas que se listan a continuación, dejando los resultados de cada una en archivos queryN.csv y localizados en el mismo directorio que el ejecutable. Sólo se listan los barrios presentes en el archivo CSV de barrios.
❖ Fromato de salida: NOMBRE DEL BARRIO;TOTAL DE ARBOLES DEL BARRIO
● Orden de impresión : Descendente por cantidad de árboles y luego alfabético por nombre de barrio.
Ejemplo de salida para 🇦🇷 :
BARRIO;ARBOLES
11;35620
12;34118
9;33601
10;31012
4;29946
...
Ejemplo de salida para 🇨🇦 :
BARRIO;ARBOLES
KENSINGTON-CEDAR COTTAGE;10012
HASTINGS-SUNRISE;9128
RENFREW-COLLINGWOOD;9128
DUNBAR-SOUTHLANDS;8289
SUNSET;6223
...
❖ Fromato de salida: NOMBRE DEL BARRIO;TOTAL DE ARBOLES POR HABITANTE
→ TOTAL DE ARBOLES POR HABITANTE consiste en el cociente entre el total de árboles de ese barrio y el número de habitantes del mismo
→ TOTAL DE ARBOLES POR HABITANTE se imprime truncado a dos decimales
● Orden de impresión : Descendente por cantidad de árboles y luego alfabético por nombre de barrio.
Ejemplo de salida para 🇦🇷 :
BARRIO;ARBOLES_POR_HABITANTE
9;0.24
10;0.20
11;0.20
15;0.16
12;0.11
...
Ejemplo de salida para 🇨🇦 :
BARRIO;ARBOLES_POR_HABITANTE
SHAUGHNESSY;0.92
KERRISDALE;0.53
SOUTH CAMBIE;0.51
DUNBAR-SOUTHLANDS;0.50
WEST POINT GREY;0.43
...
❖ Fromato de salida: NOMBRE CIENTIFICO DEL ARBOL;PROMEDIO DEL DIAMETRO A LA ALTURA DEL PECHO DE ESA ESPECIE
→ PROMEDIO DEL DIAMETRO A LA ALTURA DEL PECHO DE ESA ESPECIE se imprime truncado a dos decimales
● Orden de impresión : Descendente por diámetro y luego alfabético por nombre de la especie.
Ejemplo de salida para 🇦🇷 :
NOMBRE_CIENTIFICO;PROMEDIO_DIAMETRO
Sterculia coccinea;75.20
Eucalyptus tereticornis;71.12
Tristania conferta;70.39
Salix alba;66.51
Caryota urens;65.42
...
Ejemplo de salida para 🇨🇦 :
NOMBRE_CIENTIFICO;PROMEDIO_DIAMETRO
MANCHURIAN BIRCH;36.15
LEYLAND CYPRESS;35.53
AMERICAN CHESTNUT;32.11
GRAY POPLAR;32.10
JAPANESE WALNUT;29.19
...
$make clean
$make debug
$make clean
$make all
El primer parámetro a pasarle al ejecutable debe ser el path al archivo de árboles y el segundo, al archivo de barrios.
Para el caso de BUE:
$./arbolesADTBUE arbolesBUE.csv barriosBUE.csv
El ejecutable arbolesADTBUE tiene configurado que los datos se encuentran distribuidos de acuerdo a:
barriosBUE.csv:
* "nombre" en columna 1
* "habitantes" en columna 2
arbolesBUE.csv:
* "comuna" en columna 3
* "nombre_cientifico" en columna 8
* "diametro_altura_pecho" en columna 12
Para el caso de VAN:
$./arbolesADTVAN arbolesVAN.csv barriosVAN.csv
El ejecutable arbolesADTVAN tiene configurado los datos se encuentran distribuidos de acuerdo a:
barriosBUE.csv:
* "nombres" en columna 1
* "habitantes" en columna 2
arbolesBUE.csv:
* "NEIGHBOURHOOD_NAME" en columna 13
* "COMMON_NAME" en columna 7
* "DIAMETER" en columna 16