Uma nova arquitetura para redes neurais ópticas utiliza modelagem de frente de onda para manipular com precisão o percurso de pulsos ultracurtos através de fibras multimodo, permitindo a computação óptica não linear.
Os atuais sistemas de inteligência artificial dependem de bilhões de parâmetros ajustáveis para atingir objetivos complexos. No entanto, a grande quantidade destes parâmetros incorre em despesas significativas. O treinamento e a implementação de modelos tão extensos exigem memória e poder de processamento consideráveis, disponíveis apenas em enormes instalações de data centers, consumindo energia equivalente às demandas elétricas das cidades de médio porte. Em resposta, os investigadores estão actualmente a reavaliar tanto a infra-estrutura informática como o aprendizado de máquina algoritmos para garantir que o avanço sustentável da inteligência artificial continue no ritmo atual.
A implementação óptica de arquiteturas de redes neurais é um caminho promissor devido à implementação de baixo consumo de energia das conexões entre as unidades. Nova pesquisa relatada em Fotônica Avançada combina a propagação de luz dentro de fibras multimodo com um pequeno número de parâmetros programáveis digitalmente e atinge o mesmo desempenho em tarefas de classificação de imagens com sistemas totalmente digitais com mais de 100 vezes mais parâmetros programáveis.
Esta estrutura computacional simplifica o requisito de memória e reduz a necessidade de processos digitais que consomem muita energia, ao mesmo tempo que atinge o mesmo nível de precisão em uma variedade de tarefas de aprendizado de máquina.
Avanço em computações ópticas não lineares
O cerne deste trabalho inovador, liderado pelos professores Demetri Psaltis e Christophe Moser da EPFL (Instituto Federal Suíço de Tecnologia em Lausanne), reside no controle preciso de pulsos ultracurtos em fibras multimodo por meio de uma técnica conhecida como modelagem de frente de onda. Isso permite a implementação de cálculos ópticos não lineares com microwatts de potência óptica média, alcançando um passo crucial na realização do potencial das redes neurais ópticas.
“Neste estudo, descobrimos que com um pequeno grupo de parâmetros, podemos selecionar um conjunto específico de pesos de modelo do banco de pesos que a óptica fornece e empregá-lo para a tarefa computacional pretendida. Dessa forma, utilizamos fenômenos naturais como hardware de computação, sem nos preocuparmos em fabricar e operar um dispositivo especializado para esse fim”, afirma Ilker Oguz, principal coautor do trabalho.
Este resultado marca um avanço significativo no sentido de enfrentar os desafios colocados pela crescente demanda por modelos maiores de aprendizado de máquina. Ao aproveitar o poder computacional da propagação da luz através de fibras multimodo, os pesquisadores abriram caminho para soluções de hardware altamente eficientes e de baixo consumo de energia em inteligência artificial.
Conforme apresentado no experimento de óptica não linear relatado, esta estrutura computacional também pode ser usada para programar com eficiência diferentes fenômenos não lineares de alta dimensão para executar tarefas de aprendizado de máquina e pode oferecer uma solução transformadora para a natureza intensiva de recursos dos atuais modelos de IA.
Referência: “Programação de propagação não linear para máquinas de aprendizagem óptica eficientes” por Ilker Oguz, Jih-Liang Hsieh, Niyazi Ulas Dinc, Uğur Teğin, Mustafa Yildirim, Carlo Gigli, Christophe Moser e Demetri Psaltis, 25 de janeiro de 2024, Fotônica Avançada.
DOI: 10.1117/1.AP.6.1.016002