Reprodutibilidade em pesquisas linguísticas: por que precisamos falar sobre isso
- Monclar Guimarães Lopes

- há 2 dias
- 3 min de leitura
Recentemente tive a oportunidade de participar de uma mesa sobre reprodutibilidade e métodos quantitativos na Linguística, em um encontro da ABRALIN. O convite me levou a refletir sobre uma questão central para o fazer científico: como tornar nossas pesquisas cada vez mais verificáveis, ampliáveis e cumulativas.
Essas três propriedades costumam ser consideradas características fundamentais da ciência. Dizemos que um resultado científico é verificável quando outros pesquisadores podem examinar e testar os procedimentos que levaram àquele resultado. A ciência é ampliável porque novas investigações podem expandir ou refinar estudos anteriores. E ela é cumulativa porque o conhecimento se constrói historicamente, apoiando-se em evidências e debates que se acumulam ao longo do tempo.
No entanto, quando olhamos com atenção para muitos trabalhos empíricos — especialmente aqueles que utilizam métodos quali-quantitativos —, percebemos um desafio importante. Frequentemente temos acesso apenas ao resultado final das análises, expresso em tabelas, percentuais ou modelos estatísticos, mas não ao percurso analítico completo que produziu esses resultados. Etapas como filtragem de dados, critérios de categorização, decisões de exclusão ou scripts estatísticos muitas vezes permanecem invisíveis ao leitor.
Essa opacidade metodológica tem algumas consequências. Ela aumenta a dependência da autoridade do pesquisador, dificulta a replicação das análises e limita a possibilidade de que outros pesquisadores ampliem o estudo original com novos dados ou novos modelos. Em outras palavras, o conhecimento continua cumulativo no plano teórico, mas pode se tornar menos verificável e menos ampliável no plano empírico.
É nesse ponto que o conceito de reprodutibilidade ganha relevância. Tornar uma pesquisa reprodutível significa explicitar o caminho analítico que levou aos resultados: os critérios de seleção dos dados, as etapas de tratamento do corpus, as variáveis consideradas, os testes estatísticos utilizados e, sempre que possível, os próprios bancos de dados e scripts empregados na análise. Ao tornar esse percurso acessível, permitimos que outros pesquisadores refaçam a análise, confirmem os resultados, proponham refinamentos ou explorem novas hipóteses.
Mais do que uma exigência técnica, a reprodutibilidade é também um elemento fundamental da chamada Ciência Aberta. Ela transforma pesquisas individuais em pontos de partida para novas investigações, favorecendo a comparação entre corpora, a integração de novos dados e o desenvolvimento cumulativo do conhecimento linguístico.
Espaços de diálogo promovidos por associações científicas são essenciais para avançarmos nessa agenda. É nesses fóruns que podemos discutir desafios concretos — desde questões éticas envolvendo dados até limitações estruturais do gênero artigo científico — e compartilhar estratégias para tornar nossas pesquisas mais transparentes e reutilizáveis.
Trata-se de uma reflexão importante sobre como práticas de documentação metodológica, compartilhamento de dados e abertura de códigos podem fortalecer a robustez das pesquisas linguísticas.
Discutir reprodutibilidade, em última instância, é discutir como fazemos ciência — e como podemos torná-la cada vez mais confiável, compartilhável e cumulativa.
Mais sobre o autor
O Dr. Monclar Guimarães Lopes é Professor de Língua Portuguesa do Departamento de Letras Clássicas e Vernáculas da Universidade Federal Fluminense (UFF). Atua também no Programa de Pós-Graduação em Estudos de Linguagem da UFF e é coordenador da Graduação em Letras (Licenciaturas). Bolsista da FAPERJ, dedica-se à pesquisa e ao ensino na área de estudos linguísticos e literários.
Bibliografia
FERREIRA, M. K.; VANZ, S. A. S. Reprodutibilidade em E-Science: uma visão geral dos conceitos relacionados e das ferramentas de suporte mais citadas. Encontros Bibli, v. 30, 2025: e103385.
FREITAG, R. M. K.; MARTINS, M. A. R.; ARAÚJO, A.; BATTISTI, E.; COELHO, I. M. W. DA S.; SOUSA, M. D. A. F.; SILVA, R. G. DA; LIMA-LOPES, R. E. Desafios da gestão de dados linguísticos e a Ciência Aberta. Cadernos de Linguística, v. 2, n. 1, p. 01-19.
SOUZA, M. D. A. F.; FREITAG, R. M. K. Bancos de dados sociolinguísticos e a Ciência Aberta: compartilhamento de dados e conhecimentos. Revista Diálogos (RevDia), v, 12, n. 1, p. 165-187, 2024.




Comentários