Home > Artigos > Quais os Tipos Mais Comuns de Rotulagem de Dados?

26-08-2022

Quais os Tipos Mais Comuns de Rotulagem de Dados?

Tipos - Comuns - Rotulagem  Dados


Vejamos quais são as grandes categorias de Rotulagem de Dados:


Visão Computacional:

 

Ao construir um sistema de visão computacional, primeiro precisa rotular imagens, pixels ou pontos-chave, ou criar um rebordo que envolva totalmente uma imagem digital, conhecida como caixa delimitadora, para gerar o conjunto de dados de treino. Por exemplo, pode classificar as imagens por tipo de qualidade (como imagens de produtos versus estilo de vida) ou conteúdo (o que realmente está na própria imagem) ou pode segmentar uma imagem no nível de pixel. Pode utilizar estes dados de treino para construir um modelo de visão computacional para categorizar imagens automaticamente, detetar a localização de objetos, identificar pontos-chave numa imagem ou segmentar uma imagem.

 

Natural Language Processing (NLP):


O NLP (processamento de linguagem natural) exige primeiro que tudo a identificação manual de secções importantes de texto ou identificar o texto com rótulos específicos para gerar o conjunto de dados de treino. Por exemplo, pode querer identificar o sentimento ou a intenção de uma sinopse de texto, identificar partes do discurso, classificar nomes próprios como lugares e pessoas e identificar texto em imagens, PDFs ou outros arquivos. Para isso, pode desenhar caixas delimitadoras ao redor do texto e depois transcrever manualmente o texto no seu conjunto de dados de treino. Os modelos de NLP são utilizados para análise de sentimentos, reconhecimento de nome de entidade e reconhecimento ótico de caracteres.

 

Processamento de Áudio:

 

O processamento de áudio converte todos os tipos de sons, como fala, ruídos da vida selvagem (latidos, assobios ou gorjeios) e sons de construção (quebra de vidros, scans / varrimentos ou alarmes) num formato estruturado para que possa ser utilizado no Machine Learning. O processamento de áudio geralmente exige que primeiro transcreva manualmente em texto escrito. A partir daí, pode descobrir informações mais detalhadas sobre o áudio adicionando tags e categorizando o áudio. Este áudio categorizado torna-se no conjunto de dados de treino.

 

Artigos relacionados:

 

 

 

 

 
 
 

👉 Follow @niuGIS

RELACIONADAS


Contacte-nos 214 213 262

Informações