Indo além dos códigos - Perspectiva de um embaixador da RBR nos maiores eventos de Dados e IA do Brasil
- Túlio Gois

- 24 de nov.
- 3 min de leitura
Entre os dias 29 de setembro e 2 de outubro foi realizado o 40º Simpósio Brasileiro de Banco de Dados (SBBD) em conjunto com a 35ª Conferência Brasileira de Sistemas Inteligentes (BRACIS). Sediado em Fortaleza, no Ceará, o evento também integrou o 16º Simpósio Brasileiro em Tecnologia da Informação e Linguagem Humana (STIL), o 22º Encontro Nacional de Inteligência Artificial e Computacional (ENIAC) e o 13º Simpósio sobre Descoberta de Conhecimento, Mineração e Aprendizado (KDMiLe).
A realização simultânea desses eventos fortaleceu de forma significativa o diálogo entre as comunidades de Dados, Inteligência Artificial e Processamento de Linguagem Natural (PLN). Esse diálogo ficou evidente nas sessões científicas, que trouxeram estudos envolvendo aplicações de grandes modelos de linguagem (LLMs) em diferentes domínios da computação, métodos de engenharia de dados para otimização de modelos de IA e discussões éticas e ambientais sobre o uso e o custo das atuais IAs generativas.

É inegável que os holofotes recaíram sobre os LLMs e seu principal uso atual: as Inteligências Artificiais Generativas. Entretanto, o tema foi abordado com rigor acadêmico e sem a premissa de “tecnologia insuperável” frequentemente presente no debate público. Tutoriais exploraram aplicações de LLMs como avaliadores (“LLM as a Judge”), comparações entre abordagens clássicas de PLN e métodos baseados em modelos de linguagem, além de trabalhos trazendo o custo ambiental desses modelos — reforçando que ainda estamos longe de considerá-los soluções definitivas.
Indo além do PLN, mas ainda em diálogo com ele, os dados também tiveram um lugar central no evento. Métodos orientados a dados (data-driven) fazem parte da pesquisa científica há décadas, e o SBBD continua sendo um espaço privilegiado para acompanhar esses avanços. Workshops como “Data Science for Social Good”, “Dataset Showcase” e “Brazilian e-Science” reuniram diferentes frentes da área de dados, permitindo a disseminação de novas técnicas, métodos e, especialmente, conjuntos de dados úteis a diversas áreas do conhecimento.
Essa união de grandes comunidades é extremamente benéfica, tanto do ponto de vista científico quanto social. São áreas correlatas que se alimentam mutuamente e que ganham muito ao compartilhar espaços, ideias e práticas. Pode-se afirmar que essa realização conjunta dos maiores eventos de IA, Dados e PLN do Brasil foi um feito grandioso, merecedor de amplo reconhecimento — das pessoas que organizaram e palestraram às que contribuíram com trabalhos, tutoriais e discussões.
Perspectiva de um embaixador da Rede Brasileira de Reprodutibilidade
Estar presente nessa convergência de eventos foi, sem sombra de dúvidas, um marco na minha trajetória acadêmica. Pude conversar, ouvir e prestigiar o trabalho de pessoas que até então conhecia apenas pelos sobrenomes e pelas publicações. Além disso, vivenciar o “ar de evento” traz um forte senso de pertencimento à comunidade e motiva a seguir contribuindo.
Enquanto embaixador da RBR, mantive atenção especial aos QR Codes presentes nas apresentações e banners, bem como às menções à reprodutibilidade ao longo das falas. Foi uma surpresa positiva perceber que a disponibilização de artefatos de pesquisa (dados, códigos e demais materiais) tem se tornado mais frequente nos eventos científicos de computação — mesmo sendo conhecida por movimentos como “Open Source” e “Open Data”, a área ainda possui uma parcela significativa de trabalhos sem artefatos acessíveis.
Aprofundando o olhar sobre reprodutibilidade, alguns trabalhos apresentaram iniciativas promissoras, como a descrição explícita do hardware utilizado e o uso de contêineres (ambientes que reúnem todas as dependências necessárias à execução de um código) para facilitar a replicação dos experimentos. Embora ainda não sejam práticas majoritárias, tais iniciativas ajudam a fomentar e a dar visibilidade ao tema.

No STIL, apresentei o trabalho intitulado “Avaliação de eficiência na leitura: uma abordagem baseada em PLN”, onde tratei do desenvolvimento de um método automatizado para a correção de testes de compreensão leitora. Para isso, utilizei um modelo de repositório criado no âmbito do meu projeto como embaixador da RBR, voltado à melhor organização e documentação dos artefatos de pesquisa, buscando ampliar transparência, acessibilidade e reprodutibilidade. O artigo está publicado nos Anais do STIL, e o repositório encontra-se disponível no GitHub.
Por fim, foi particularmente gratificante perceber o reconhecimento crescente do trabalho da RBR e o espaço cada vez maior dado à reprodutibilidade na área de computação. Uma evidência marcante veio pouco mais de uma semana após o evento: no dia 13 de outubro, a Sociedade Brasileira de Computação anunciou sua integração à Rede Brasileira de Reprodutibilidade.
Mais sobre o autor
Túlio Gois é graduando em Engenharia de Computação pelo Departamento de Computação da Universidade Federal de Sergipe (DCOMP/UFS) e pesquisador de Iniciação Científica nas áreas de Processamento de Linguagem Natural e Ciência de Dados de Pesquisa pelo Laboratório Multiusuário de Documentação e Processamento Linguístico (LAMID). Como Embaixador da RBR, desenvolve materiais, tutoriais e treinamentos sobre reprodutibilidade na pesquisa, com ênfase em métodos baseados em ciência de dados.




Comentários