Las redes neuronales profundas se han convertido en herramientas ubicuas en numerosos dominios computacionales, desde el reconocimiento de imágenes hasta el procesamiento del lenguaje. Sin embargo, el crecimiento exponencial de la complejidad de los modelos ha generado un aumento proporcional en el consumo de energía. Esta limitación energética representa ahora un obstáculo práctico significativo para alcanzar tamaños de modelo viables, impulsando investigación urgente en paradigmas de computación alternativos que ejecuten operaciones de redes neuronales con demandas de potencia sustancialmente reducidas. El cuello de botella computacional en estos sistemas se centra en operaciones de multiplicación matriz-vector, sugiriendo que los enfoques ópticos ejecutados en circuitos integrados fotónicos podrían ofrecer ventajas energéticas convincentes sobre implementaciones electrónicas tradicionales.

La estrategia convencional para construir redes neuronales fotónicas integradas implica ensamblar componentes ópticos programables discretos —como interferómetros Mach-Zehnder o resonadores microring— interconectados a través de guías de onda monomodo. Estas arquitecturas realizan operaciones ópticas lineales ejecutando multiplicaciones matriz-vector entre entradas codificadas ópticamente y matrices programadas electrónicamente. No obstante, las implementaciones existentes se han limitado a dimensiones de vector manejables muy por debajo del umbral requerido para que los sistemas ópticos demuestren ganancias significativas de eficiencia energética en relación con contrapartes electrónicas, que los investigadores estiman en aproximadamente mil dimensiones o más. Esta limitación surge de dos desafíos principales. La integración de sistemas ópticos y eléctricos requiere enrutar enormes cantidades de cableado electrónico a través del perímetro del chip, limitando el número de parámetros programables a varios cientos como máximo. Además, los componentes ópticos individuales ocupan espacio físico sustancial debido a dimensiones a escala de longitud de onda y las limitaciones inherentes de la programabilidad actual de materiales ópticos.

Un enfoque fundamentalmente diferente trata el chip fotónico como un medio continuo con distribución de índice de refracción programable espacialmente. En lugar de construir redes a partir de componentes discretos, este paradigma aprovecha el volumen completo del chip como un elemento óptico programable. Esta investigación aborda un desafío técnico central: crear un dispositivo fotónico donde la distribución del índice de refracción pueda programarse arbitrariamente y reconfigurarse sin introducir esquemas complejos de integración electrónica. Los intentos anteriores con cristales fotorrefractivos lograron modulación de índice insuficiente, mientras que enfoques recientes con materiales de cambio de fase sufrieron de ciclos de reescritura limitados y pérdidas ópticas sustanciales, con demostraciones restringidas a escalas dimensionales mínimas.

Este trabajo introduce una guía de onda fotónica programable bidimensional utilizando niobato de litio como medio activo. El dispositivo emplea modulación electroóptica masivamente paralela en aproximadamente diez mil regiones espaciales direccionables individualmente, habilitando control preciso sobre propagación de ondas multimodales. El mecanismo de programabilidad funciona ópticamente en lugar de electrónicamente: patrones de iluminación proyectados en el dispositivo crean campos eléctricos espacialmente variables que inducen modulación del índice de refracción a través del efecto electroóptico, con cambios del índice de refracción alcanzando aproximadamente 10⁻³. Este enfoque de ganancia fotoconductiva permitió a los investigadores aplicar voltajes altos —aproximadamente un kilovoltio— mientras disipaban potencia eléctrica mínima y evitaban enrutamiento electrónico complejo a bordo.

La demostración empleó una resolución espacial de nueve micrómetros en un área programable de nueve milímetros por un milímetro, generando aproximadamente diez mil parámetros controlables actualizados a tres hertz. Los vectores de entrada se codificaban como distribuciones de modo óptico espacial, mientras que la salida se medía mediante detección por cámara de distribuciones de intensidad en la salida del dispositivo. El entrenamiento utilizó retropropagación consciente de la física, combinando pasadas forward experimentales con retropropagación digital del modelo, habilitando optimización eficiente a pesar de imperfecciones experimentales y ruido.

Los investigadores validaron el enfoque mediante dos tareas de aprendizaje automático de referencia. En clasificación de vocales a partir de características acústicas, el dispositivo logró noventa y seis por ciento de precisión en prueba en un problema de siete clases usando entradas de doce dimensiones después de trescientos épocas de entrenamiento. Para reconocimiento de dígitos manuscritos MNIST usando imágenes de siete por siete píxeles submuestreadas aplanadas a cuarenta y nueve dimensiones, el sistema alcanzó ochenta y seis por ciento de precisión, comparable a una red neuronal electrónica de una sola capa, a pesar de desafíos de modelado adicionales de desvío experimental.

El análisis teórico revela propiedades de escalado favorables. Mientras que circuitos fotónicos tradicionales requieren escalado de longitud del dispositivo como N veces la longitud de onda dividida por cambio de índice programable, el enfoque multimodal puede lograr escalado de longitud proporcional a la raíz cuadrada de N, multiplicada por longitud de onda y dividida por cambio de índice. Este escalado superior surge porque implementar transformaciones unitarias de alta dimensión requiere cambios de fase promedio más pequeños por elemento de lo que comúnmente se asume. Aunque la implementación experimental actual operaba en un régimen débilmente guiado sin capturar estos beneficios de escalado, las simulaciones sugieren que las guías de onda multimodales verdaderas con dimensiones modestas podrían realizar transformaciones en sistemas de doscientas dimensiones o incluso mil dimensiones.

El trabajo demuestra una prueba de concepto para procesadores fotónicos reconfigurables capaces de realizar operaciones ópticas arbitrarias especificadas a través de distribuciones del índice de refracción. Más allá de inferencia de redes neuronales, tales dispositivos podrían abordar ecuaciones integrales y problemas de optimización. El enfoque proporciona una base para versiones completamente integradas que combinen propagación de ondas lineal programable con efectos no lineales y ganancia, potencialmente habilitando una plataforma de computación fotónica reconfigurable de propósito general aproximándose a las capacidades de sistemas ópticos de espacio libre mientras mantiene ventajas de circuitos integrados.


Guías de Ondas Fotónicas Programables Prometen Redes Neuronales Más Rápidas y Eficientes

Un equipo de investigadores de fotónica ha presentado una guía de onda de niobato de litio reconfigurable que puede programarse con diez mil parámetros independientes para realizar versiones ópticas de las multiplicaciones matriz-vector que dominan las cargas de trabajo modernas de inteligencia artificial, demostrando clasificación de sonidos vocálicos y dígitos manuscritos con una fracción de la potencia normalmente consumida por chips electrónicos.

El experimento, detallado en un estudio recientemente publicado y revisado por pares, aborda el apetito energético creciente de modelos de aprendizaje profundo dirigiendo luz —en lugar de electrones— a través de una losa bidimensional cuyo índice de refracción puede reescribirse bajo demanda. Al combinar codificación de entrada óptica con entrenamiento de retropropagación consciente de la física, el grupo demostró que una sola capa de su dispositivo puede alcanzar noventa y seis por ciento de precisión en un conjunto de datos vocálico de siete clases y ochenta y seis por ciento en una tarea MNIST de dígitos manuscritos submuestreada, todo mientras consume potencia negligible en el chip.

Temprano en el proyecto, los investigadores enfrentaron un cuello de botella de la industria: aunque las redes neuronales fotónicas integradas tradicionales teóricamente pueden ejecutarse más rápido y con menor latencia que aceleradores electrónicos, los chips actuales alcanzan máximo solo unos pocos cientos de elementos programables. Ese déficit cae muy por debajo de las matrices de aproximadamente mil dimensiones que expertos estiman necesarias para que la fotónica supere a la electrónica en eficiencia. El nuevo trabajo propone una arquitectura fundamentalmente diferente —tratando el chip como un medio continuo y reescribible en lugar de una colección de interferómetros discretos— y suministra evidencia experimental que la idea escala.

Los modelos de aprendizaje profundo siguen expandiéndose en tamaño, impulsando aumentos anuales en facturas de electricidad de centros de datos e impulsando a ingenieros a buscar hardware que pueda multiplicar matrices cada vez más grandes sin un aumento equivalente en joules. Los observadores de la industria señalan que los sistemas fotónicos «ofrecen más ancho de banda y ejecutan más pasos de computación en menos tiempo y con menor latencia que sus contrapartes electrónicas» SPIE Photonics Focus. Sin embargo, la mayoría de demostraciones de redes neuronales ópticas han permanecido confinadas a bancos de laboratorio porque cableado de miles de voltajes de control alrededor de cientos de interferómetros Mach-Zehnder o resonadores microring tensa tanto el perímetro del chip como el presupuesto de sala limpia.

La plataforma de niobato de litio descrita en el nuevo estudio evita estos dolores de cabeza de interconexión aprovechando el efecto electroóptico del material. En lugar de ejecutar trazas de metal a cada peso, el equipo ilumina el chip con un patrón de luz espacial que fotogenera portadores. Esos portadores bajan localmente la resistencia de una capa superficial de otro modo aislante, permitiendo que una polarización de kilovoltio global caiga en cualquier píxel que el algoritmo de entrenamiento seleccione. El cambio de índice de refracción resultante —aproximadamente 10⁻³— dirige modos guiados a través de interferencia constructiva o destructiva, escribiendo efectivamente los pesos de la red neuronal directamente en el dieléctrico.

Para probar el concepto, el grupo fabricó una guía de onda de 9 milímetros de largo, 1 milímetro de ancho con resolución de 9 micrometros, generando aproximadamente diez mil regiones direccionables independientes. Los vectores de entrada llegaban como distribuciones de modo espacial lanzadas en la guía; los vectores de salida emergían como patrones de intensidad capturados por una cámara. Debido a que el dispositivo es analógico e inherentemente ruidoso, los investigadores combinaron pasadas forward reales con un modelo digital de la física inversa para calcular gradientes, un enfoque que denominan retropropagación consciente de la física.

El análisis de referencia en dos tareas canónicas de aprendizaje automático proporcionó un vistazo temprano de la utilidad práctica. Para un problema de clasificación de vocales que comprende vectores de características de doce dimensiones y siete clases de salida, el procesador fotónico alcanzó una precisión de prueba del noventa y seis por ciento después de trescientos épocas. En la porción MNIST de cuarenta y nueve dimensiones y diez categorías, la precisión se estabilizó en ochenta y seis por ciento, comparable a una red electrónica convencional de una sola capa, a pesar del desvío ambiental y resolución modesta.

Esos números aún no destronan el estado del arte de silicio, pero prestan credibilidad a proyecciones teóricas de escalado. Una suposición de larga data en el campo sostiene que una transformación unitaria de N dimensiones necesita una longitud de dispositivo proporcional a N. El análisis del equipo argumenta que, porque cada elemento óptico en una guía multimodal solo necesita proporcionar un cambio de fase diminuto, la longitud requerida puede encoger a la raíz cuadrada de N, reduciendo drásticamente la huella y la pérdida. Las simulaciones numéricas sugieren que las guías de onda multimodales verdaderas de solo unos pocos centímetros de largo podrían realizar transformaciones de doscientas a mil dimensiones, el umbral en el cual se espera que la fotónica supere a la electrónica en energía por operación.

El trabajo se inserta en una onda más amplia de innovación que empuja las redes neuronales ópticas hacia relevancia práctica. A principios de este año, investigadores reportaron «una implementación novedosa de red neuronal óptica en chip» que apunta a hacer tales sistemas más fáciles de desplegar en tareas de computación del mundo real Optica OPN. Otro estudio demostró nuevos diseños de redes fotónicas que «superan las limitaciones de profundidad encontradas anteriormente, logrando mejor precisión» Nature Communications. Junto con el avance actual de niobato de litio, estos esfuerzos forman un kit de herramientas complementario: redes más profundas, activación no lineal en chip, y ahora capas lineales anchas de alta dimensión.

Obstáculos técnicos permanecen. El dispositivo actual actualiza su mapa de pesos a solo tres hertz, órdenes de magnitud más lento que la SRAM electrónica, y la polarización de 1 kilovoltio, aunque ahorradora de potencia gracias a la ganancia fotoconductiva, no es precisamente lista para uso en electrónica de consumidor. La estabilidad a largo plazo también requiere dominar el desvío ambiental; el experimento MNIST, por ejemplo, necesitó recalibración frecuente. Finalmente, integrar no linealidad óptica directamente en el mismo sustrato es un desafío abierto, aunque el progreso en materiales de cambio de fase e moduladores χ(2) sugiere caminos viables hacia adelante.

Sin embargo, el argumento de energía es convincente. La multiplicación matriz-vector domina la inferencia y el entrenamiento, y los circuitos fotónicos realizan esa multiplicación a la velocidad de la luz, con disipación de potencia estática cero dentro de la guía de onda misma. El único costo energético surge de moduladores y detectores en la periferia, que pueden ser amortizados sobre cargas de trabajo de alto rendimiento. Si versiones futuras pueden incrustar funciones de activación y ganancia, el resultado podría ser un computador fotónico reconfigurable de propósito general que cabe en una oblea de semiconductor pero se aproxima a la flexibilidad de bancos ópticos de espacio libre voluminosos.

Los estrategas de la industria observan atentamente. Los proveedores de nube ya han desplegado GPU refrigerados por líquido y procesadores de tensor personalizados pero enfrentan rendimientos decrecientes a medida que los modelos escalan hacia billones de parámetros. Los aceleradores ópticos podrían desplazar esa curva, suministrando computación bruta con una envoltura de potencia más plana. La demostración de niobato de litio sugiere un plan: renunciar a la idea de construir un sistema nervioso de interferómetros individuales e en su lugar tratar el chip completo como un lienzo analógico, repintado de nuevo para cada tarea.

Si

Fuentes

  • https://spie.org/news/photonics-focus/julyaugust-2025/optical-computing-illuminating-ai
  • https://www.optica-opn.org/home/newsroom/2025/april/photonic_chips_go_nonlinear/
  • https://www.nature.com/articles/s41467-025-65356-0