Otimização de Parâmetros de Buffer Pool com Aprendizado de Máquina em Ambientes Não Transacionais

  • Eduardo P. Mendizabal UnB
  • Geraldo P. Rocha Filho UESB
  • Aleteia Araujo UnB

Resumo


A parametrização eficiente de Sistemas Gerenciadores de Banco de Dados (SGBD) é condição essencial para assegurar níveis de serviço estáveis e mitigar picos de latência em ambientes corporativos críticos. Este trabalho apresenta uma solução automatizada de configuração do buffer pool, baseada em uma solução que emprega Aprendizado de Máquina (AM) e Otimização Bayesiana. Assim, aplicou-se Análise Fatorial Exploratória (AFE) associada a K-Means para reduzir a dimensionalidade e eleger métricas representativas. Em seguida, empregou-se regressão LASSO para filtrar variáveis determinantes. Por fim, utilizou-se Regressão com Processo Gaussiano (GPR) e políticas de aquisição bayesiana para gerar recomendações de configuração. Avaliada em um repositório de dados de grande instituição financeira, a solução proporcionou diminuição média de 18% na latência máxima de I/O síncrono. Os resultados evidenciam reprodutibilidade analítica, transparência nas decisões e adaptabilidade a cenários não transacionais, oferecendo uma solução extensível para governança proativa de SGBD em produção.

Referências

Aken, D. V. et al. (2017). Automatic dbms tuning through large-scale ml. In Proc. ACM ICDE, pages 1009–1024.

Aken, D. V. et al. (2021). Ml-based automatic config tuning on real dbmss. Proc. VLDB Endow., 14(7):1241–1253.

Ansel, J. et al. (2014). Opentuner: an extensible program auto-tuning framework. In Proc. Int. Conf. Parallel Archit. Compilation, pages 303–316. ACM.

Cai, Y. et al. (2022). Hunter: an online cloud db hybrid tuner. Proc. VLDB Endow., pages 646–659.

Casella, G. and Berger, R. L. (2002). Statistical Inference. Duxbury, 2nd edition.

Cereda, A. et al. (2021). Cgptuner: contextual gp bandit approach. Proc. VLDB Endow., 14(8):1401–1413.

Duarte, D. and Ståhl, N. (2019). Machine learning: a concise overview. In Data Science in Practice, volume 46, pages 27–58. Springer.

Joshi, K. K. et al. (2020). Ml–learning techniques, cnn, languages & apis. Int. J. Sci. Res. Comput. Sci. Eng. Inf. Technol., 5(3):23–30.

Kanellis, V. et al. (2022). Llamatune: sample-efficient dbms configuration tuning. arXiv:2203.05128.

Lee, W.-M. (2019). Python Machine Learning. Wiley.

Li, J.-P. et al. (2020). Ml & credit-ratings prediction. Technol. Forecast. Soc. Change, 161:120309.

Rasmussen, C. E. and Williams, C. K. I. (2005). Gaussian Processes for Machine Learning. MIT.

Shahriari, B. et al. (2016). A review of bayesian optimization. Proc. IEEE.

Shaveta (2023). A review on machine learning. Int. J. Sci. Res. Arch., 9(1):281–285.

Storm, A. and Surendra, S. (2006). Adaptive self-tuning memory in db2. VLDB Endow.

Sullivan, R. (2012). Machine-learning techniques. In Intro. Data Mining Life Sci., pages 363–454. Humana.

Tan, J. et al. (2019). ibtune: individualized buffer tuning. Proc. VLDB Endow., 12(10):1221–1234.

Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. J. R. Stat. Soc. B, 58(1):267–288.

Trendafilov, N. and Hirose, K. (2023). Exploratory factor analysis. In Int. Encycl. Educ., pages 600–606. Elsevier, 4th edition.

Trummer, I. (2021). Db-bert: a database tuning tool that ‘reads the manual’.

Vasyliev, A. (2024). Pgtune: configuring postgresql for max hardware performance. Online.

Vyawahare, H. R. (2022). Machine learning: solution for complex problems. Int. J. Sci. Res. Eng. Manag., 6(4):1–6.

Yong, A. and Pearce, J. (2013). A beginner’s guide to factor analysis: focusing on efa. Tutorials Quant. Methods Psychol., 9(2):79–94.

Zhang, X. et al. (2021). Restune: meta-learning for cloud dbs. Proc. VLDB Endow., pages 2102–2114.

Zhang, X. et al. (2022). Towards dynamic & safe configuration tuning for cloud dbs. Proc. VLDB Endow., pages 631–645.

Zhao, Y. et al. (2023). Auto-config tuning for dbs: survey. VLDB J., 32:835–862.
Publicado
28/10/2025
MENDIZABAL, Eduardo P.; ROCHA FILHO, Geraldo P.; ARAUJO, Aleteia. Otimização de Parâmetros de Buffer Pool com Aprendizado de Máquina em Ambientes Não Transacionais. In: SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 26. , 2025, Bonito/MS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 73-84. DOI: https://doi.org/10.5753/sscad.2025.15841.