O banco de dados do CRITT para a pesquisa do processo tradutório

Autores

  • Michael CARL Center for Research and Innovation in Translation and Translation Technology (CRITT), Departamento de Comunicação em Negócios Internacionais, Copenhagen Business School (CBS), Frederiksberg, Dinamarca
  • Moritz SCHAEFFER Center for Research and Innovation in Translation and Translation Technology, Departamento de Comunicação em Negócios Internacionais, Copenhagen Business School (CBS), Frederiksberg, Dinamarca. Instituto de Linguagem, Cognição e Computação, Universidade de Edimburgo, Edimburgo, Reino Unido
  • Srinivas BANGALORE Interactions Corporation, New Providence, NJ, Estados Unidos
  • Traduzido por Leonardo Penha MESQUITA UFU
  • Leonardo Lima Beschizza dos SANTOS

Palavras-chave:

pesquisa empírica do processo tradutório, banco de dados de pesquisas do processo tradutório

Resumo

Desde sua criação, há dez anos, o Center for Research and Innovation in Translation and Translation Technology (CRITT), da Copenhagen Business School (CBS), Dinamarca, está envolvido em pesquisas do processo tradutório. Os dados dessas pesquisas foram coletados inicialmente pela ferramenta Translog e publicados em 2012 como um banco de dados das pesquisas do processo tradutório (em inglês, Translation Process Research Database, ou TPR-DB). Desde 2012, outros experimentos foram realizados, e mais dados foram adicionados ao TPR-DB. Em particular, dentro do projeto CASMACAT – do inglês, Cognitive Analysis and Statistical Methods for Advanced Computer Aided Translation (SANCHIS-TRILLES et al., 2014) –, foi gravada uma grande quantidade de dados do processo de pós-edição de tradução automática, e o TPR-DB foi disponibilizado sob uma licença Creative Commons. No momento da redação deste artigo, o TPR-DB contém quase 30 estudos com tarefas de tradução, pós-edição, escrita (autoral) e/ou cópia, todas gravadas com o Translog e/ou com a ferramenta CASMACAT. Cada estudo é constituído por cerca de oito a mais de 100 sessões de gravação, envolvendo mais de 300 tradutores. Atualmente, os dados somam mais de 500 horas de produção textual reunidas em mais de 1.400 sessões, com mais de 600.000 palavras traduzidas para mais de dez línguas-alvo diferentes. Este artigo descreve os recursos e as opções de visualização do TPR-DB. Esse banco de dados contém registros do processo, bem como informações derivadas e anotadas organizadas em sete tipos de unidades simples e compostas do processo e do produto, adequadas para investigar os processos de tradução humana e assistida por computador, bem como para realizar modelagem avançada dos usuários.

Downloads

Não há dados estatísticos.

Referências

ALVES, F.; VALE, D. C. On drafting and revision in translation: a corpus linguistics oriented analysis of translation process data. Translation: Corpora, Computation, Cognition, v. 1, n. 1,p. 105-122, 2011. Disponível em: <http://www.t-c3.org/>. Acesso em: 8 nov. 2017.

CARL, M. Translog-II: A program for recording user activity data for empirical reading and writing research. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES

AND EVALUATION, 8., Istanbul, Tyrkiet, Department of International Language Studies and Computational Linguistics, 21-27 maio 2012a. Proceedings… Istanbul: [s.e.], 2012. p. 2- 6.

CARL, M. The CRITT TPR-DB 1.0: A database for empirical human translation process research. In: O’BRIEN, S.; SIMARD, M.; SPECIA, L. (Ed.). Proceedings of the AMTA 2012 workshop on post-editing technology and practice (WPTP 2012). Stroudsburg, PA: Association for Machine Translation in the Americas (AMTA), 2012b. p. 9-18.

CARL, M.; KAY, M. Gazing and typing activities during translation: a comparative study of translation units of professional and student translators. Meta, v. 56, n. 4, p. 952-975, 2011.

JAKOBSEN, A. L. Translation drafting by professional translators and by translation students. In: HANSEN, G. (Ed.). Empirical translation studies: process and product. Copenhagen: Samfundslitteratur, 2002. p. 191-204.

JAKOBSEN, A. L. Instances of peak performance in translation. Lebende Sprachen, v. 50, n. 3, p. 111-116, 2005.

JAKOBSEN, A. L. Tracking translators’ keystrokes and eye movements with Translog. In: ALVSTAD, C.; HILD, A.; TISELIUS, E. (Ed.), Methods and strategies of process research: integrative approaches in translation studies. Amsterdam: John Benjamins, 2011. p. 37-55.

JAKOBSEN, A. L.; SCHOU, L. Translog documentation. In: HANSEN, G. (Ed.). Probing the process in translation methods and results. Copenhagen: Samfundslitteratur, 1999. p. 1- 36.

GERMANN, U. Yawat: Yet Another Word Alignment Tool. In: ACL-08. Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics: HLT demo session. Columbus, OH: Association for Computational Linguistics, 2008. p. 20-23.

LACRUZ, I.; SHREVE, S. Pauses and cognitive effort in post-editing. In post-editing of machine translation: processes and applications. In: O’BRIEN, S.; SIMARD, M.; SPECIA, L.; CARL, M.; BALLING, L. W. (Ed.). Expertise in post-editing: Processes, technology and applications. Cambridge: Scholars Publishing, 2014. p. 246–274.

LEIJTEN, M.; VAN WAES, L. Keystroke logging in writing research: using Inputlog to analyze and visualize writing processes. Written Communication, v. 30, n. 3, p. 358-392, 2013.

SANCHIS-TRILLES, G.; ALABAU, V.; BUCK, C.; CARL, M.; CASACUBERTA, F.;

GARCÍA-MARTÍNEZ, M.; GERMANN, G.; GONZÁLEZ-RUBIO, J.; HILL, R. L.;

KOEHN, P.; LEIVA, L. A.; MESA-LAO, B.; ORTIZ-MARTÍNEZ, D.; SAINT-AMAND, H.; TSOUKALA, C.; VIDAL, E. Interactive translation prediction versus conventional postediting in practice: a study with the CASMACAT workbench. Machine Translation, v. 28, n. 3-4, p. 217-235, 2014.

VANDEPITTE, S.; HARTSUIKER, R. J.; VAN ASSCHE, E. Process and text studies of a translation problem. In: FERREIRA, A.; SCHWIETER, J. W. (Ed.). Psycholinguistic and cognitive inquiries into translation and interpreting. Amsterdã/Filadélfia: John Benjamins, 2015. p. 127-143.

Downloads

Publicado

30.05.2018