Normalización de la Información Educativa en Procesos Digitalizados de Contratación
- Poves, Rus
- Zbib, Rabih
- García Sardiña, Laura
- Retyk, Federico
- Fabregat, Hermenegildo
- Alvarez Lacasa, Lucas
ISSN: 1135-5948
Ano de publicación: 2023
Número: 71
Páxinas: 63-73
Tipo: Artigo
Outras publicacións en: Procesamiento del lenguaje natural
Resumo
Los procesos de contratación digitalizados suelen basarse en información clave extraída automáticamente de los currículums. El caso de la trayectoria educativa es especialmente conflictivo, considerando la creciente cantidad de titulaciones, por lo que su normalización es decisiva para la posterior explotación de dichos datos. En este trabajo definimos la normalización de la información educativa como su transformación en una serie de pares nivel-campo de estudio. Para ello, definimos y compartimos una nueva taxonomía de campos de estudio en el contexto laboral. Desarrollamos un sistema sencillo en el que el nivel de estudios se identifica mediante reglas expertas, y el campo de estudios se normaliza utilizando una combinación de reglas para cubrir las ocurrencias más frecuentes y predicciones de clasificadores para generalizar sobre los casos menos frecuentes. Evaluamos el sistema propuesto en un nuevo test set compartido públicamente y probamos su aplicación en un caso de uso de comparación candidato-empleo.
Referencias bibliográficas
- Aanen, S. S., D. Vandic, and F. Frasincar. 2015. Automated product taxonomy mapping in an e-commerce environment. Expert Systems with Applications, 42(3):1298–1313.
- Araki, S. 2020. Educational expansion, skills diffusion, and the economic value of credentials and skills. American Sociological Review, 85(1):128–175.
- Dai, K., C. G. Nespereira, A. F. Vilas, and R. P. D. Redondo. 2015. Scraping and clustering techniques for the characterization of linkedin profiles. In CS & IT Conference Proceedings, volume 5. CS & IT Conference Proceedings.
- Decorte, J.-J., J. Van Hautte, T. Demeester, and C. Develder. 2021. JobBERT: Understanding job titles through skills. In FEAST2021, the International Workshop on Fair, Effective And Sustainable Talent management using data science.
- Devlin, J., M.-W. Chang, K. Lee, and K. Toutanova. 2018. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.
- Hancock, A. 2022. Australian and new zealand standard research classification (anzsrc). ISKO Encyclopedia of Knowledge Organization.
- Jaunzeme, I. and S. Busule. 2022. Employability of university graduates in changing labour market conditions: Case of Latvia. In ICERI2022 Proceedings, pages 5611– 5611. IATED.
- Jia, Q., D. Zhang, S. Yang, C. Xia, Y. Shi, H. Tao, C. Xu, X. Luo, Y. Ma, and Y. Xie. 2021. Traditional chinese medicine symptom normalization approach leveraging hierarchical semantic information and text matching with attention mechanism. Journal of Biomedical Informatics, 116:103718.
- Kingma, D. P. and J. Ba. 2015. Adam: A method for stochastic optimization. In Y. Bengio and Y. LeCun, editors, 3rd International Conference on Learning Representations, ICLR 2015, San Diego, CA, USA, May 7-9, 2015, Conference Track Proceedings.
- Skinner, M. and S. Kallumadi. 2019. Ecommerce query classification using product taxonomy mapping: A transfer learning approach. In eCOM@ SIGIR.
- UNESCO Institute for Statistics. 2012. International standard classification of education: ISCED 2011. Comparative Social Research, 30.
- UNESCO Institute for Statistics. 2014. ISCED Fields of Education and Training 2013 (ISCED-F 2013): manual to accompany the International Standard Classification of Education.
- Ziletti, A., A. Akbik, C. Berns, T. Herold, M. Legler, and M. Viell. 2022. Medical coding with biomedical transformer ensembles and zero/few-shot learning. In Proceedings of the 2022 NAACL-HLT: Industry Track, pages 176–187.