Ouvidoria      Proteção de Dados     Transparência

  1. Home
  2. /
  3. NOTÍCIAS
  4. /
  5. Conhecimento sobre processamento de...

Conhecimento sobre processamento de linguagem natural beneficia projetos no CIASC e são apresentados em congressos internacionais

O processamento de linguagem natural foi o mote de duas linhas de pesquisa desenvolvidas pela profissional Rossana da Cunha Flores, analista de Sistemas na Gerência de Produtos de Software (GPROS), do Centro de Informática e Automação do Estado de Santa Catarina (CIASC). O resultado disso será apresentado em dois congressos internacionais, o The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), dia 20 de maio, na Itália, e a 2024 Annual Conference of the North American Chapter of the Association for Computational Linguistic (NAACL 2024), previsto para junho, no México.

Rossana conta que defendeu o doutorado em novembro de 2023, com Processamento de Linguagem Natural (PLN) e aplicação chatbot na área da saúde, o que gerou uma oportunidade dentro da Coordenadoria de Soluções da Fazenda (CSFAZ), para a aplicação desse conhecimento em projetos realizados pelo CIASC.

O outro trabalho teve como ponto de partida a base de dados do Instituto Nacional de Pesquisa Espacial (INPE), como planilhas e números, relacionados à Amazônia Legal e às áreas de queimadas. Ademais, foram utilizadas fontes de dados durante a pandemia sobre a COVID-19. “Um robô jornalista consegue, a partir dessas informações em números, transformá-las em textos capazes de dar acessibilidade àqueles dados”, ela comenta.

O seu conhecimento em IA Generativa levou ao convite para integrar a CSFAZ, a qual faz parte desde 2022. “Hoje, sou a única pessoa fora do grupo de auditores fiscais que integra a equipe responsável pelos projetos de IA na CSFAZ”.

Os artigos

No estudo que será apresentado na LREC, na Itália, Rossana fala que embora os modelos de PLN tenham merecido grande atenção, só nos últimos anos é que a investigação abriu novos caminhos para abordar a interação humano-computador (IHC) na perspetiva da linguagem natural.

“Neste artigo, nos concentramos no desenvolvimento de um corpus centrado no ser humano, mais especificamente, baseado em personas num domínio específico dos cuidados de saúde (diabetes mellitus). Mostramos que uma abordagem IHC beneficia a geração de linguagem de diferentes perspectivas, desde as máquinas aos seres humanos – contribuindo com novas direções para contextos de poucos recursos (línguas que não o inglês e domínios sensíveis) em que a necessidade de promover uma comunicação eficaz é essencial”.

Já no material aprovado para o “Workshop on Insights from Negative Results in NLP” – NAACL, intitulado “Imaginary Numbers! Evaluating Numerical Referring Expressions by Neural End-to-End Surface Realization Systems”, ela propôs uma abordagem em que as expressões numéricas de referência fossem convertidas de dígitos para descrições em forma de palavras simples antes de serem introduzidas nos grandes modelos de linguagem (LLMs – Large Language Models) mais avançados.

 

Relacionados

Confira algumas de nossas soluções

Pular para o conteúdo