Informações da proteção | ||
Título: Extração de Entidades Nomeadas do Diário Oficial da União (DOU) Com Processamento De Linguagem Natural (PLN) | ||
Nº da proteção: | BR 51 2019 002939 9 | |
Instituições titulares: | Universidade de Brasília (UnB) | | Link do site |
Data da expedição do registro: | 24/12/2019 | |
Data da publicação ou criação: |
17/12/2018 | |
Tipo de proteção: | programa de computador | |
Linguagem: | Outros | |
Prazo legal de proteção: | 50 anos contados a partir de 1º de janeiro do ano subseqüente ao da sua publicação ou, na ausência desta, | |
da sua criação (art 2º, §2º da Lei nº 9.609/1998). | ||
Inventores | ||
Pela UnB: | Rafael Timóteo de Sousa Júnior | | Lattes |
Robson de Oliveira Albuquerque | | Lattes | |
Vanderlei Jandir Alles | | Lattes | |
William Ferreira Giozza | | Lattes | |
Unidades da UnB envolvidas do desenvolvimento da tecnologia | ||
Unidade Acadêmica: | Faculdade de Tecnologia (FT) | | Link do site |
Departamento: | Departamento de Engenharia Elétrica (ENE) | | Link do site |
CLASSIFICAÇÃO | ||
Classificação - Categoria: | Ciências exatas e informática | |
Classificação - Subcategoria: | Inteligência Artificial |
INTELIGÊNCIA ARTIFICIAL PARA PROCESSAMENTO DE LINGUAGEM NATURAL NA ADMINISTRAÇÃO PÚBLICA
O processamento de linguagem natural (PLN) é uma área da inteligência artificial que estuda como os computadores podem entender e gerar textos em linguagem humana. Essa tecnologia pode ser útil na administração pública, pois permite automatizar tarefas que envolvem o processamento de documentos, como classificação, extração de informações, resumo, tradução e geração de textos, além de possibilitar a análise de grandes volumes de dados textuais. As principais vantagens do PLN são a rapidez, a precisão e a escalabilidade, pois as máquinas podem processar grandes volumes de dados em pouco tempo e com baixo custo. No entanto, o PLN também enfrenta desafios, como a diversidade e a complexidade das línguas humanas, a necessidade de dados de qualidade e de ética no uso da tecnologia, e a garantia de segurança e privacidade dos dados processados.
Sob essa perspectiva, pesquisadores da Universidade de Brasília (UnB), desenvolveram um programa de computador intitulado “Construção de um Corpus para extrair entidades nomeadas do Diário Oficial da União utilizando Aprendizado Supervisionado”. O programa é uma ferramenta de processamento de linguagem natural (PLN) que utiliza o Diário Oficial da União (DOU) como fonte de informação para identificar e classificar entidades nomeadas, tais como pessoas, organizações, locais, datas e valores. O programa também propõe a construção de um corpus anotado manualmente com as entidades nomeadas extraídas do DOU, e avalia o desempenho do método de extração utilizando esse corpus como referência. Além disso, o programa implementa uma aplicação que mostra os resultados das extrações do corpus utilizado, facilitando a verificação e a análise dos dados.
VANTAGENS
• Segurança: Utiliza o Diário Oficial da União como fonte de informação confiável e atualizada para identificar e classificar entidades nomeadas;
• Eficiência: Avalia o desempenho do método de extração utilizando o corpus do DOU, verificando a qualidade e a precisão dos resultados;
Demostra os resultados das extrações do corpus utilizado, facilitando a verificação e a análise dos dados;
Contribui para o avanço do conhecimento sobre o reconhecimento de entidades nomeadas em português.
• Escalabilidade: Processamento de grandes volumes de dados em pouco tempo.
Agenda 2030 da ONU:
Gostou dessa tecnologia?
Entre em contato com a Agência de Comercialização de Tecnologias (ACT) da Coordenação de Inovação eTransferência de Tecnologia (CITT) do Centro de Apoio ao Desenvolvimento Tecnológico (CDT).