Saltar al contingut principal

9. Recerca i desenvolupament

Durant l'any 2022 s'han desenvolupat diverses línies d'innovació, entre les quals destaquen les línies d'àmbit transversal següents:

  • Registre estadístic de territori
  • Sistemes de georeferenciació
  • Sistema integrat de metadades (Qualitas)

D'altra banda, l'Idescat ha dedicat recursos a les següents línies d'innovació tècnica o metodològica de caràcter més vertical:

  • Enquesta de condicions de vida (ECV)
  • Enquesta del finançament i la despesa de l'ensenyament privat (EFDE)
  • Enquesta d'usos del temps (EUT)
  • Sistema estadístic d'informació laboral
  • Desenvolupament de l'Estadística de comerç amb l'estranger i de l'Estadística de comerç amb l'estranger segons contingut tecnològic a la Plataforma Cerdà
  • Desenvolupament de l'Estadística de l'activitat del turisme rural a la Plataforma Cerdà
  • Desenvolupament de sistemes de pertorbació en la difusió de l'Estadística de l'ocupació assalariada i autònoma segons afiliacions a la Seguretat Social
  • Desenvolupament dels mètodes de validació d'adreces i geocodificació de la informació d'afiliacions i comptes de cotització a la Seguretat Social
  • Indicadors de l'economia circular
  • Projecte experimental de web scraping

També s'han fet millores conceptuals en estadístiques econòmiques sectorials, que es detallen a l'apartat corresponent.

9.1. Línies d'innovació estadística

Línies d'àmbit transversal

Registre estadístic de territori

Objectiu: Millorar la qualitat i l'exhaustivitat del Registre estadístic de territori. L'any 2022 s'han geocodificat per primera vegada les adreces dels comptes de cotització de la Tresoreria General de la Seguretat Social i les adreces de treball dels autònoms afiliats. Per tal de dur a terme aquests treballs s'ha creat una nova aplicació en JAVA per al tractament de les adreces que no s'han pogut codificar de forma automàtica. Aquesta aplicació utilitza el Google Web Tool-kit (GWT) per desenvolupar en JAVA la part de client i s'han utilitzat eines d'Open Layers (OL) per a la visualització de les adreces en mapes. L'aplicació proporciona, per a cada adreça que s'ha de geocodificar, una llista d'adreces del mateix municipi similars quant al tipus i nom de la via. En seleccionar manualment una adreça de les candidates, aquesta es visualitza en un mapa i permet diferents opcions (assignar-la com a correcta, avançar a la següent sense eliminar-la o assignar-la com a adreça no localitzada). L'aplicació fa una sèrie de tractaments per extreure automàticament el tipus de via, eliminar les parts innecessàries de l'adreça o assignar el número de carrer. Addicionalment permet assignar una adreça concreta a partir de la seva selecció al mapa.

Sistemes de georeferenciació

Objectiu 1: Disposar d'una xarxa de transport per trobar camins òptims entre dos punts, així com poder calcular els costos associats en espai i temps.

Es tracta d'una informació bàsica per conèixer la distribució de costos que té la població per arribar a certes infraestructures depenent de la localització de què disposen moltes aplicacions, per exemple per prendre decisions en relació amb la posició de certes infraestructures futures.

S'han analitzat les diferents fonts i s'ha optat per utilitzar la informació disponible en el projecte Open Street Maps (OSM). S'han descarregat les dades de carreteres relatives al territori de Catalunya, així com les corresponents a l'Aragó i els departaments veïns de França. S'han descarregat també les dades de la xarxa de ferrocarrils, de metro i les corresponents a les xarxes de bus urbà i interurbà.

Tota aquesta informació s'ha integrat en una base de dades PostGIS amb l'extensió pgroute, i s'ha creat un graf complet de comunicacions.

S'ha analitzat la seva qualitat general i s'ha observat que totes les subxarxes eren de prou bona qualitat excepte la de bus. Per a la subxarxa de bus s'ha editat la informació original per tal d'assegurar la coherència topològica de la subxarxa (hi havia molts problemes de sentits de marxa erronis).

El resultat final del procés d'integració i anàlisi de connectivitat és que la qualitat és prou bona en els casos de les carreteres, trens i metro, però en el cas de bus queda pendent si el projecte OSM farà versions més acurades.

S'han desenvolupat funcions postGIS/pgroute que serveixen por obtenir el camí òptim i els costos entre dos punts (dues adreces geocodificades) utilitzant l'algoritme Dijkstra bidireccional.

Atès que el nombre de càlculs a realitzar són relativament grans (potencialment tants com portals diferents) i que el càlcul és relativament lent, s'ha procedit, en primer lloc a optimitzar al màxim les dades del graf (utilitzant RTrees clusteritzats amb les dades i sobretot fent que els càlculs es limitin a una zona rectangular prou gran que inclogui els punts d'origen i destinació).

Addicionalment s'ha desenvolupat una aplicació Java que fa el càlcul de rutes en paral·lel, fent una partició de conjunt total d'orígens/destinacions. El resultat final és que el càlcul és gairebé tant més ràpid com el factor de partició utilitzat.

Per testar les dades, la seva optimització i el càlcul en paral·lel, es va procedir a calcular, municipi a municipi, el temps de desplaçament de tota la població de Catalunya a l'hospital més proper.

Objectiu 2: Classificar els municipis segons el seu grau d'urbanització

Eurostat va determinar i publicar una metodologia per classificar els municipis en tres categories: ciutats grans o àrees densament poblades, ciutats mitjanes o àrees semidenses i àrees rurals o àrees de densitat de població baixa. Aquesta metodologia parteix del grid estàndard europeu i, a partir del càlcul de la població dins de cada cel·la s'han delimitat i classificat els municipis en cadascuna de les tres categories.

Idescat ha implementat aquesta metodologia per tal de disposar de la classificació dels municipis més actualitzada possible (anys 2018, 2019 i 2020). També s'han analitzat els efectes d'utilitzar grids de més precisió i s'ha vist que els resultats, efectivament, depenen de la precisió del grid. Els resultats d'aquests treballs han estat objecte de ponències en diferents congressos.

Objectiu 3: Calcular quins són els municipis rurals remots

Segons Eurostat un municipi és remot quan, a més d'estar localitzat en una àrea rural de baixa densitat està situat a més de 45 minuts per carretera de la ciutat gran més propera. S'ha utilitzat la xarxa de carreteres d'Open Street Maps i el programari propi de l'Idescat per fer el càlcul en paral·lel amb l'objectiu de calcular la distribució de temps de recorregut per carretera per a cadascun dels habitants dels municipis rurals, a la ciutat més propera. Per a aquells municipis en què la mediana del temps de desplaçament és superior als 45 minuts s'ha classificat el municipi com a municipi rural remot.

Sistema integrat de metadades (Qualitas)

Objectiu: Millorar l'actual sistema integrat de metadades: perfeccionament de l'aplicació de gestió de la documentació de les metadades dels processos estadístics; elaboració de nous informes metodològics estandarditzats en el marc del model GSIM (Generic Statistical Information Model) i de l'SDMX (Statistical Data and Metadata Exchange), i documentació de les variables associades als processos estadístics, a càrrec de l'Idescat.

Línies d'àmbit vertical

Enquesta de condicions de vida (ECV)

Objectiu: Canvi metodològic relacionat amb el fet que la mostra addicional de l'Idescat segueix un model de panel rotant amb 4 torns de rotació, això vol dir que s'investigaran les mateixes unitats al llarg dels 4 anys. Canvi metodològic relacionat amb la definició de l'indicador taxa AROPE que afecta dos dels seus tres components, concretament els de baixa intensitat en el treball i de la privació material i social severa. Aquesta nova definició respon als canvis metodològics introduïts per Eurostat per recollir els objectius de l'Agenda 2030 de la UE.

Enquesta del finançament i la despesa de l'ensenyament privat (EFDE)

Objectiu: Desenvolupament de la nova aplicació de gestió via web per a la recollida de la informació dels centres educatius (universitaris i no universitaris) per a la realització del treball de camp de l'enquesta. Aquesta aplicació incorpora notables millores respecte de l'anterior i permet una gestió més àgil i eficient del seguiment del treball de camp, així com incrementar el volum d'informació final de l'operació disponible.

Enquesta d'usos del temps (EUT)

Objectiu: Finalització de l'elaboració del projecte tècnic de l'EUT. Elaboració de la mostra representativa per a determinades àrees territorials i grau d'urbanització segons la classificació d'Eurostat (DGURBA). Treballs de desenvolupament de l'aplicació de gestió que els usuaris a enquestar hauran d'utilitzar. Desenvolupament dels qüestionaris electrònics de la llar, individual i diari d'activitat.

Sistema estadístic d'informació laboral

Objectiu: Desenvolupament conceptual del sistema integrat d'informació estadística laboral, concebut com un ecosistema de dades que es basa en el gran potencial dels registres administratius per generar informació de qualitat, però que també està integrat per fonts de base mostral i preveu l'aprofitament d'altres fonts internes i externes i/o de base agregada. Alhora, s'interconnecta amb els registres bàsics de població, entitats i territori i els seus respectius satèl·lits, fet que ha de permetre analitzar la informació segons diverses perspectives. L'objectiu principal és la producció eficient i enriquida d'estadístiques relacionades amb el mercat laboral.

Desenvolupament de l'Estadística de comerç amb l'estranger i de l'Estadística de comerç amb l'estranger segons contingut tecnològic a la Plataforma Cerdà

Objectiu: Desenvolupament dels processos estadístics i d'estimació associats a l'Estadística de comerç amb l'estranger i a l'Estadística de comerç amb l'estranger segons contingut tecnològic utilitzant el programari desenvolupat per la Plataforma Cerdà, i desenvolupament de les tabulacions, rànquings i jerarquies de navegació de la informació.

Desenvolupament de l'Estadística de l'activitat del turisme rural a la Plataforma Cerdà

Objectiu: Desenvolupament dels processos estadístics i d'estimació associats a l'Estadística de l'activitat del turisme rural utilitzant el programari desenvolupat per la Plataforma Cerdà, i desenvolupament de les tabulacions, rànquings i jerarquies de navegació de la informació.

Desenvolupament de sistemes de pertorbació en la difusió de l'Estadística de l'ocupació assalariada i autònoma segons afiliacions a la Seguretat Social

Objectiu: Desenvolupament dels processos de pertorbació en la difusió de la informació com a mètode de protecció de la revelació estadística i d'ampliació de la capacitat de publicació d'informació de variables jeràrquiques.

Desenvolupament dels mètodes de validació d'adreces i geocodificació de la informació d'afiliacions i comptes de cotització a la Seguretat Social

Objectiu: Desenvolupament dels mètodes i processos de validació d'adreces i geocodificació amb l'objectiu de millorar la ubicació geogràfica de la informació, permetre desagregacions territorials d'àmbit inframunicipal i classificacions territorials diferents a la dels àmbits estàndard.

Indicadors de l'economia circular

Objectiu: Anàlisi de viabilitat per a la construcció i difusió d'un marc d'indicadors anuals dels indicadors de l'economia circular per a Catalunya prenent com a referència la bateria d'indicadors d'Eurostat.

Projecte experimental de web scraping

Objectiu: Desenvolupament d'un projecte pilot experimental per avaluar l'oportunitat d'utilitzar de manera estable l'ús de la tècnica del web scraping per disposar d'informació sobre les constitucions, modificacions i dissolucions d'empreses a Catalunya, i de les seves característiques i ubicació de seu social, amb finalitats estadístiques.

9.2. Revista SORT (Statistics and Operations Research Transactions)

L'any 2022 és el vintè de la revista SORT (Statistics and Operations Research Transactions), publicació científica internacional coeditada per l'Idescat i set universitats catalanes, orientada a la recerca aplicada en l'àmbit de l'estadística, la investigació operativa, la bioestadística i l'estadística oficial.

Des del 2007 la revista SORT està indexada a les bases de dades del Science Citation Index Expanded. L'any 2021 el factor d'impacte es va situar a 1,759.

Factor d'impacte de la revista SORT. 2017–2021
Any 2021 2020 2019 2018 2017
Factor d'impacte 1,759 1,185 0,778 1,125 1,344

Durant l'any 2022 s'han publicat els dos números del volum 46 i s'ha continuat el procés de gestió editorial de la revista per mitjà de la plataforma RACO (Revistes Catalanes amb Accés Obert), en el marc del conveni amb el Consorci de Serveis Universitaris de Catalunya.

En aquest exercici, el nombre d'articles sotmesos a revisió ha estat de 59, una xifra molt similar a la de l'any passat.

D'altra banda, el nombre de pàgines publicades ha estat superior al de l'any anterior (260 pàgines per 222 l'any 2021), amb un total de deu articles entre els dos números del volum 46.

Números de SORT publicats el 2022
Títol Data
Volume 46, Number 1, January–June 2022 Juny del 2022
Volume 46, Number 2, July–December 2022 Desembre del 2022