Robótica

China criou um banco de dados facial 3D gigante para evolução de Robôs Humanoides

O novo conjunto de dados faciais 3D em grande escala, juntamente com o novo modelo de IA, pode detectar pontos de referência faciais sem depender de imagens 2D ou modelos digitais.

A maioria das empresas especializadas no desenvolvimento de robôs humanóides concentra-se na China. Das cerca de 220 empresas do setor no mundo, 160 estão na China, garantindo ao país 87% do mercado. Enquanto essas 160 montam as máquinas, outras 600 fabricam componentes críticos como sensores e atuadores.

Apesar da fama do Tesla Optimus vir de Elon Musk, a China lidera em inovação: com mais de 7.700 patentes, empresas como AgiBot e Unitree já superam a concorrência e entregam milhares de humanoides anualmente.

Ciente da falta de concorrência, a China acelera sua produção para dominar o mercado global de robôs humanoides. A meta é fabricar 100 mil unidades até 2026, focando em serviços e na indústria automotiva (NIO e BYD). Agora, a China construiu uma enorme base de dados de rostos 3D para aperfeiçoar as suas criações.

Uma das maiores coleções estruturadas de dados faciais

Investigadores criaram um dataset facial 3D em larga escala e uma IA que detecta pontos de referência em dados brutos, dispensando imagens 2D ou modelos digitais. O objectivo é permitir que eles expressem emoções, reconheçam identidades e interajam naturalmente.

O estudo, publicado na IEEE, foca-se na deteção de pontos-chave 3D em digitalizações do mundo real, superando as limitações dos modelos atuais que dependem de texturas 2D ou dados sintéticos.

Esta abordagem é sujeita a erros por divergências entre modelos digitais e a geometria real, além de falhas no alinhamento de texturas. O estudo foi liderado por Zhan Song (SIAT/CAS) e Ye Yuping (Universidade de Tecnologia de Fujian).

A equipe desenvolveu um sistema de captura facial 3D/4D e reuniu 200 mil digitalizações de alta fidelidade. A base inclui dados de expressões, pontos de referência e modelos dinâmicos do corpo e rosto.

Estes recursos biométricos multimodais compõem uma das maiores colecções estruturadas de dados faciais humanos 3D reais relatadas até o momento. O conjunto foi seleccionado para o Programa de Conjuntos de Dados de IA de Alta Qualidade de 2025 da província de Fujian. Em vez de alimentar o sistema de IA com imagens texturizadas, os investigadores projectaram uma rede de atenção de grafos CF-GAT para processar directamente nuvens de pontos desordenadas.

O CF-GAT utiliza atenção gráfica para prever coordenadas 3D a partir de dados brutos. Ao dispensar texturas 2D ou modelos predefinidos, o sistema torna-se menos dependente da aparência da superfície. Nos testes, o modelo mostrou maior robustez ao ruído e melhor generalização em diferentes formas faciais em comparação com as abordagens convencionais.

As descobertas destacam como conjuntos de dados em grande escala e de alta qualidade podem influenciar directamente o desempenho do algoritmo.Ao treinar o modelo com geometria detalhada do mundo real, os desenvolvedores permitem que ele aprenda padrões espaciais mais complexos.