微纳制造
服务信息网

“机器微纳光学科学家”:人工智能在微纳光学设计的应用与发展

2024-08-16

微纳光学材料与器件是光通信、光传感、生物光子学、激光、量子光学等诸多光学领域的关键。目前微纳光学设计主要依赖传统数值方法,存在依赖计算资源、创新效率低、得到全局最优设计困难的难题,是当前微纳光学设计的瓶颈。人工智能(artificial intelligence,AI)目前已经在多个学科开展应用,带来了科学研究的新范式。

本文从微纳光学设计对象、数据集构建、学习任务与算法以及性能度量四个方面对AI在微纳光学设计领域的应用进行综述。对AI在微纳光学研究中的难点及未来的发展趋势进行了分析与展望。

01 引 言

微纳光学主要研究光学衍射极限及突破衍射极限尺度下(即光的波长和亚波长尺度)的光学现象及应用。从紫外、可见至近红外光学波段,其研究尺度包括μm、百nm乃至几十nm的范围之内。通过结构设计实现光波的调控,当前微纳光学设计研究热点主要包括:亚波长光子回路所需的分束器、波分复用器、解复用器、光子晶体光纤、半导体激光器、手性光学材料,生物医学应用的超分辨率成像器件、超透镜,打破光的折射、反射定律且具有强大光场调控能力的超表面、微环谐振腔结构及回音壁微腔等。

微纳光学材料与器件的设计研究主要依赖时域有限差分(finite-difference time-domain,FDTD)、有限元法(finite element method,FEM)]、有限差分法(finite difference method,FDM)等数值方法的仿真模拟。数值模拟方法在很大程度上依赖设计经验,模拟计算占用大量计算资源,需要多次迭代优化逐渐提升性能,难以实现全局最优且需要耗费大量时间。同时,优化过程中产生的大量数据未能得到充分利用。

人工智能(artificialintelligence,AI)为科学发展带来了新范式:AIforscience。AI已经成功用于化学、材料学、量子力学、粒子物理等领域。微纳光学设计方面,AI已经应用于手性材料、功率分配器、微结构光纤、光子晶体光纤、钙钛矿太阳能电池、等离子体波导等设计研究。相较于传统数值仿真方法,AI应用于微纳光学设计具有以下技术优势。

微纳光学材料与器件的设计研究主要依赖时域有限差分(finite-difference time-domain,FDTD)、有限元法(finite element method,FEM)]、有限差分法(finite difference method,FDM)等数值方法的仿真模拟。数值模拟方法在很大程度上依赖设计经验,模拟计算占用大量计算资源,需要多次迭代优化逐渐提升性能,难以实现全局最优且需要耗费大量时间。同时,优化过程中产生的大量数据未能得到充分利用。

人工智能(artificialintelligence,AI)为科学发展带来了新范式:AIforscience。AI已经成功用于化学、材料学、量子力学、粒子物理等领域。微纳光学设计方面,AI已经应用于手性材料、功率分配器、微结构光纤、光子晶体光纤、钙钛矿太阳能电池、等离子体波导等设计研究。相较于传统数值仿真方法,AI应用于微纳光学设计具有以下技术优势:

1. 计算资源依赖性低、效率高:相较于数值模拟,AI可以在极短时间内预测微纳光学结构的光学特性;

2. 可达全局最优:基于大量数据训练得到的AI模型,可以对微纳光学材料与器件的结构特性做到全局优化,逼近理论特性极限;

3. “辅助发明”发现新结构:通过逆向设计,可以从最优光学特性中反向求解得到AI“发明”的光学材料与器件设计结构;

4. 凝练微纳光学新知识:通过AI“辅助发明”新结构。通过AI模型可解释性与辅助发明结构的光学物理意义分析,可以凝练得到新的微纳光学设计新知识;

5. 在未来实现“机器微纳光学科学家”,通过AI实现对微纳光学的研究。

以检索式“TI (neural network OR learning) AND (optic OR light OR photonic) AND (design OR prediction)”在Web of Science数据库进行文献检索,结果如图1所示:AI在光学设计中应用相关的发文数量从2012年的3篇增长至2022年的51篇,10年间相关研究发表数量呈现稳步提升的状态:基于AI的设计方法已经成为当前微纳光学设计的发展趋势。


▲图1 基于AI的微纳光学设计年出版文献统计

目前微纳光学设计通常以光子学理论为基础,依赖大量数值仿真实现光学性能的优化。微纳光学设计领域诸多新材料、新器件的设计研究依然依赖经验驱动。因此,现有光学设计方法较难实现全局最优。AI的出现为解决这一难题提供了新的研究思路,通过将AI技术应用于微纳光学设计过程之中,使微纳光学设计实现全局最优成为了可能。

在微纳光学材料与器件设计领域中AI微纳光学设计概念图如图2所示,将微纳光学材料与器件由仿真、实验获取的结构和光学特性数据分别制作为样本空间和标记空间,利用AI的回归算法实现微纳光学材料与器件的性能预测,利用生成/分类算法实现逆向设计。通过设置相应的性能度量参数来优化AI的性能表现,还可借助迁移学习算法将现有的AI模型用于其他微纳光学材料与器件的设计之中。


▲图2 AI微纳光学设计概述

本文以AI在微纳光学材料与器件的设计角度出发,从微纳光学设计对象、数据集的构建,学习任务与算法构建及性能度量四个方面出发,对AI应用于微纳光学设计的现有工作与研究方法进行阐述。本文分为以下6个部分:第1节为引言;第2节阐述微纳光学设计的代表性设计对象;第3节论述AI微纳光学设计数据集的构建方法;第4节讨论微纳光学设计中学习任务与算法模型的构建;第5节对算法模型性能度量进行分析;第6节对AI微纳光学设计中仍存在的问题与发展趋势进行分析与讨论。

02 微纳光学设计对象

微纳光学的设计对象有面向通信领域的光栅耦合器 [ 51 ] 、微结构光纤 [ 48 ] 、模式耦合器 [ 52 ] 、多模波导 [ 53 ] 相位噪声滤波器 [ 54 ] ; 面向材料领域的等离子体材料 [ 15 ] 、超表面的研究 [ 55 ] ; 面向传感领域的等离子体-声子耦合器 [ 56 ] 、X射线瞬态光栅 [ 57 ] 及光伏领域的太阳能电池 [ 58 ] 等, 如 表1 所列.

根据不同微纳光学设计对象的特点可采用不同的样本定义方式, 当所设计的微纳光学对象为平面结构, 如多模端口波导、超表面等可以直接将光学设计的图像作为样本空间. 对于结构较为简单的平面结构, 如3 dB功率分配器、解模复用器等则可以将平面结构以圆形或者方形像素点作为基本元素进行排布, 以矩阵的方式对像素点的排布位置进行标记以此构建样本空间. 对于结构复杂的微纳设计对象, 如具有多层嵌套管的光纤结构往往通过将光纤的直径、嵌套管的长轴和半轴等技术指标以参数向量的方式进行表示并构建为结构向量作为样本空间. 标记空间一般是指需要优化的技术指标, 如光纤的限制损耗(confinement loss, CL)、耦合器的耦合效率、功率分配器的透射率等. 确定好样本空间与标记空间之后就能够构建相应的数据集. 在微纳光学设计中数据集的产生来源主要为数值模拟及实验测量获得, 其中常用的数值模拟方法有FEM, FDTD等. 进一步需要确定利用AI想要实现的功能, 如通过构建回归任务以逆向设计的方式来实现微纳光学新结构的发现, 或通过构建分类任务以性能预测的方式对结构的性能进行优化. 综合考虑数据集的大小、数据集的类型及想要实现的功能, 通过深度神经网络(deep neural networks, DNN)、卷积神经网络(convolutional neural network, CNN)或粒子群优化(particle swarm optimization, PSO)等算法来对构建的数据集进行训练以实现预期的功能. 最后, 可选择合适的性能度量指标如均方误差(mean square error, MSE)、均方根误差(root mean squared error, RMSE)等并通过适当调节来优化AI的模型结构, 提高模型的性能.

AI的出现已经在常见的微纳光学设计如微结构光纤、光子晶体光纤、超表面设计等带来变革, 并取得了良好的效果, 但是对于一些较为复杂的光学结构, 如等离子体-声子耦合器、X射线瞬态光栅、相位噪声滤波器、光隔离器等, 光学设计还没有实现利用AI进行设计, 需要研究者继续努力, 探索AI的应用方法.

03 数据集构建

基于AI的微纳光学设计的首要关键问题在于数据集的构建, 相较于图像识别、医学影像智能辅助诊断等领域已经建立了相对成熟的数据集并开放共享供研究人员用于AI模型的验证, 微纳光学设计领域的数据集尚未广泛建立, 基于AI的微纳光学设计尚处于“先人工、后智能”的初步发展阶段. 其中, 数据集构建的关键步骤为: 1) 微纳光学设计对象的样本与标记定义; 2) 微纳光学设计对象样本标记海量数据的生成.

数据集的构建过程如 图3 所示, 首先将结构参数向量、像素图像及图像数据等结构样本构建为样本空间, 结构样本与波长、折射率等条件参数通过数值仿真建模、计算的方式计算出相应的光学特性, 通过标记的方法构建标记空间. 下面对结构向量、结构图像的样本如何构建, 结合典型应用案例进行论述.


▲图3 数据集的构造过程

3.1 结构向量的样本定义方式

结构向量是微纳光学材料与器件的常用样本定义方式, 利用材料与器件的几何结构参数组成向量, 可以有效描述材料与器件结构样本. Meng等 [ 48 ] 在空芯反谐振光纤(hollow-core anti-resonant fiber, HC-ARF)设计中, 即采用结构向量的样本定义方式, 利用15个结构参数来对HC-ARF的纤芯直径、包层管的长轴、短轴等结构特征数据进行表示, 用以定义HC-ARF结构.

如 图4 所示, 将光纤的CL定义为监督学习的标记. 利用FEM构建出290700个训练集数据和32300个验证集数据. 利用决策树和 K -近邻( K -nearest neighbor, KNN)算法, 实现了HC-ARF限制损耗的精确预测. 通过对比AI算法的计算结果与FEM的模拟结果, 发现基于AI的方法在实 现精确预测的同时还可以节省大量的计算时间. 相较于Meng等 [ 48 ] 直接对光学器件的物理结构进行定义, Ren等 [ 64 ] 则是选择在极坐标系定义光学器件的几何结构, 利用原点位于中心线上的极坐标系, 并使用两组极向量分别离散边界线的顶部(在[0, π)内和底部(在[π, 2π] 内)部分. 通过平滑连接这两组极性矢量并结合输入和两个输出端口而形成的完整的器件结构. 再利用深度学习与遗传算法对所构造的数据集进行处理, 仅用少量的数据集就能优化设计出超紧凑的硅基光学器件, 如具有不寻常分配比的功率分配器、TE模式转换器和宽带功率分配器.  


▲图 4   基于结构向量的空芯反谐振光纤样本

3.2 结构图像的样本定义方式

图像数据在AI设计领域, 经常用于场景识别、对象理解、图像分割及前后景分离等场景, 而现有的微纳光学器件设计中, 微纳光学器件的设计更多来源于设计师依据光学基本原理和直觉来选择器件的整体结构, 然后使用参数扫描模拟的方式对结构进行微调. 在这一过程中, 设计师只能从有限的自由度(如微纳器件的长度、宽度、厚度等)对结构进行微调, 从而实现器件性能的优化与提升. 即现有的光学设计通常是利用物理规律来进行, 图像数据在光学设计领域中似乎无用武之地, 然而Piggott等 [ 73 ] 从最基础的微纳光学器件波长解复用器出发, 将解复用器的耦合腔图像信息作为输入, 利用基于凸优化的局部优化算法对耦合腔体的结构进行优化, 设计出了面积仅为2.8 μm×2.8 μm的解复用器, 如 图5 所示. 相较于传统的波长解复用器, 如阵列波导光栅、阶梯光栅解复用器和环形谐振器阵列等尺寸从几十微米到数百微米结构, 基于AI的波长解复用器设计尺寸方面展现出具有巨大的优势.


▲图 5   波长解复用器 (a) 结构图; (b) 逆向设计过程

结构图像越分辨率越大, 所需要的算力就越多, 数据处理的成本愈大. 为了节省算力, 可将光学设计的结构图像用分辨率较低的像素图像进行代替, 这一举措已经在定向耦合器、波分复用器等结构简单的光学器件设计之中得到应用. 通过将所设计的光学器件图像进行二值化为黑白图像, 再将黑白图像按照矩形或者圆形像素进行分割, 将分割后的像素图像作为模型的输入. Tahersima等 [ 74 ] 即通过将1×2功率分配器的耦合腔部分以像素图像进行表示, 再将像素图像分割为几个半径为45 nm的20×20蚀刻孔矢量(hole vectors, HV)进行表示, 如 图6 所示. 将分配器的蚀刻孔位置进行排布作为DNN的样本定义, 将透射率作为DNN的标记定义, 利用DNN模型进行训练, 设计出了在在2.6 μm×2.6 μm的占地面积内具有90%以上的传输效率的功率分配器设计. 通过DNN模型实现对所构建微纳器件物理响应的预测. 


▲图 6   集成硅基光学功率分配器结构

通过以上典型应用案例可以发现, 对于结构复杂并涉及大量计算的微纳光学设计如空芯光纤、复杂的波导结构设计等可以采用结构向量的数据集构建方式, 用以减轻计算机的计算成本. 对于结构简单、规整的微纳光学设计如三端口、四端口的定向耦合器等光学器件, 可以将耦合腔的腔体部分以结构图像的方式作为输入, 利用AI模型进行精确的模拟. 如果自身算力条件有限, 也可以对部分结构图像进行像素化处理, 实现用较小的算力来实现器件性能的优化. 

04 学习任务与算法构建

面对种类繁多的AI模型, 如何选择合适的算法来实现智能光学设计模型的构建同样非常重要, 在这一阶段就需要对所设计光学结构的复杂程度、实验或仿真数据的数据集规模、所拥有计算机的计算性能及预期的设计指标等等因素进行综合考虑. 在当前的智能光学设计中既有采用单一算法如KNN、决策树等进行光纤CL的性能预测, 利用人工神经网络(artificial neural network, ANN)实现多模波导设计 [ 53 ] , 也有采用多种算法相结合的方式, 如采用生成对抗网络(generative adversarial network, GAN)加ANN网络的方式实现光子晶体光纤的设计 [ 49 ] , GA+DNN网络的方式实现功率分配器的设计 [ 64 ] , 及结合贝叶斯优化与CNN的超表面设计 [ 46 ] 等. 通过多种算法相结合的方式对器件的性能进行优化. 下面根据智能光学设计中所用算法的不同, 结合典型设计案例对AI在微纳光学设计中的应用进行阐述. 

4.1 人工神经网络

人工神经网络模型在认知科学领域是一种模仿生物神经网络(动物的中枢神经系统, 特别是大脑)的结构和功能的数学模型或计算模型, 用于对函数进行估计或近似 [ 75 ] . 神经网络由大量的人工神经元联结进行计算, 且神经网络通常是通过一个基于数学统计学类型的学习方法得以优化, 所以也是数学统计学方法的一种实际应用. 

在光学领域平顶光束是一种重要的激光束, 常用于高功率光纤激光器的设计, 其中最为常用的是利用M型光纤产生平顶光束(the flattop beam, FT光束), 但是光纤结构的设计通常复杂且耗时, Guo等 [ 59 ] 利用ANN的方法采用回归任务的方式来逆向设计FT束光纤. 如 图7 所示, 通过将平坦度 θ 、光纤纤芯中传输的模功率与总承载功率之比的功率限制因子 Γ 及有效面积 A eff 等7个表征FT波束性能的指标作为ANN网络的输入参数, 将5个描述M型光纤结构的结构参数作为输出参数, 利用一个具有5个隐藏层和每层100个神经元的ANN模型实现了FT光束光纤的逆向设计, 根据FT光束的性能指标, 可以确定M型光纤的结构参数. 


▲图7  FT光纤设计的人工神经网络模型

4.2 深度神经网络

深度神经网络是指在输入和输出层之间具有多层ANN的一种网络结构, 两者都具有相同的组成部分, 如神经元、突触、权重、偏差和功能. 由这些组件作为一个整体来实现类似人脑的功能. DNN已经广泛用于模式识别、数据压缩、机器翻译及语音识别等领域. 

在超宽带模式选择耦合器(ultra-wideband fiber-optics mode selective coupler, MSC)设计中, 如 图8 所示, Zhang等 [ 52 ] 借助DNN, 有效地获得了S+C+L波段上桥式光纤结构参数与线性偏振(linear polarization, LP) LP 01 模有效折射率(refractive index, RI)之间的复杂映射关系. 通过将少模光纤(few-mode fiber, FMF)中产生的所有导模的有效RI矢量用作DNN输入, 桥式光纤的直径 D core 和GeO 2 的掺杂摩尔分数 X 作为DNN的输出, 经过优化, 可以在S+C+L波段上实现桥式光纤中产生的LP 01 模的有效RI和FMF中产生的特定模的有效RI之间的超宽带相位匹配. Qie等 [ 61 ] 将DNN模型应用于超表面远场辐射体的设计之中, 通过将超表面天线以二进制图像的方式作为DNN的输入, 将超表面散射体的远场辐射数据作为DNN的输出. 构建了具有87000个样本的训练集, 以及11000个样本的测试集. 模型设计具有6个隐藏层, 每层8192个单元的网络架构来实现精准的超表面远场辐射预测, 相较于传统的基于FDTD的方式, 具有更高的准确性及更少的时间花费. 


▲图 8   桥式光纤结构

4.3 卷积神经网络

卷积神经网络是一类在各种计算机视觉任务中占据主导地位的人工神经网络, 正在引起诸如通信、生物医学等各个领域的学者的研究兴趣. CNN被设计为通过使用多个块结构(如卷积层、池化层和完全连接层)通过反向传播来自动和自适应地学习特征的空间层次 [ 76 ] . CNN在图像处理方面展现出来的巨大优势, 也吸引了许多学者将其应用在智能光学设计之中. 

Li等 [ 46 ] 利用贝叶斯优化和卷积神经网络的自洽框架(Bayesian optimization (BO) and convolutional neural network (CNN), BoNet), 来计算和优化金属纳米结构的光学特性. 通过将尺寸为10 nm×10 nm×40 nm, 位置在Si/Sio 2 上方的Au纳米天线进行编码处理, 如 图9 所示, 将Au所在的区域编码为1, 空区域编码为0, 通过FDTD的方式对具有边界条件的麦克斯韦方程进行求解, 计算出相对应的反射光谱和电场分布. 将编码过的金属纳米结构图像作为BoNet的输入, 相对应的反射光谱和电场分布作为输出, 通过训练该网络结构即可实现对光学手性特性的预测, 获得完美的光学手性.


▲图 9   将纳米结构进行编码

在硅光学器件纳米制造过程中, 纳米制造工艺中的缺陷引起的微小结构变化对集成硅基光学器件的性能影响很敏感, 对于需要精细功能尺寸以降低性能极限的下一代设备而言, 这种由工艺原因产生的器件敏感特性变化是一个非常需要关注的特性. Gostimirovic等 [ 62 ] 提出了一种用于预测平面硅光学器件制造变化的CNN模型, 并在原型制作之前验证其制造可行性. 通过对结构的最新扫描电子显微镜图像进行分析, 发现这些结构的尺寸不精确是由光刻中的邻近效应和干法蚀刻中的加载效应共同造成的. 因此通过将从图形设计系统布局(graphic design system layouts, GDS)及其对应的扫描电子显微镜(scanning electron microscope, SEM)图像中获得的图像示例中进行训练, 即可快速准确地预测过蚀刻/欠蚀刻、圆角、填充箭头通道和孔. 由此, 可以实现利用CNN算法来预测设备的预期性能, 并且可以在制造前进行一些必要的设计修正 [ 62 ] . 

4.4 生成对抗网络与ANN的组合优化

生成对抗网络是非监督式学习的一种方法, 通过两个神经网络相互博弈的方式进行学习. 该方法由伊恩·古德费洛等 [ 77 ] 于2014年提出. 生成对抗网络通常由一个生成网络与一个鉴别网络组成. 且其从潜在空间(latent space)中随机取样作为输入, 输出结果还需要尽量模仿训练集中的真实样本. 在智能光学设计领域GAN常用于数据增强作用. 

光子晶体光纤(photonic crystal fiber, PCF)由于其独特的传播特性, 如 图10 所示, 已集成到许多基于光学的设备和应用中. 与常规阶跃折射率光纤相比, 具有更好的设计灵活性和精确的导光能力, 但其灵活的传播特性及组合设计能力也为PCF的设计带来巨大的计算难度. 针对这一问题, Zelaci等 [ 49 ] 利用GAN与ANN相结合的方法进行优化, 利用GAN对1000个样本进行处理, 以优化数据集. 利用ANN对模型进行训练, 实现对所提出PCF的CL预测. 其中, GAN便是由生成器和鉴别器两个神经网络组成. 生成器将完全随机化的数据转换为遵循原始数据集分布的形式, 鉴别器评估发生器的性能并为训练提供反馈. 将PCF的结构参数作为ANN网络输入, 通过构建具有5个隐藏层, 每层有50个神经元的网络进行训练. 相较于仅基于ANN的网络架构, 利用GAN和ANN的组合网络, 可以实现在更小的样本条件下利用更快的速度实现准确的预测PCF的约束损失, 相较于传统的数值模拟方法速度更是提高了几个数量级. 


▲图 10   PCF结构

4.5 粒子群优化与ANN的组合优化

粒子群优化又称鸟群算法、微粒群算法, 是由Kennedy和Eberhart等于1995年开发的一种演化计算技术 [ 78 , 79 ] , 灵感来源于鸟群捕食行为的研究, 利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程, 从而获得最优解. 

在轨道角动量(orbital angular momentum, OAM)传输光纤设计领域, Qin等 [ 60 ] 提出了一种将ANN和粒子群优化算法相结合的混合方法. 将光纤的结构如内环、外环的半径长度等参数用作神经网络的输入, 光纤的传输特性参数如有效折射率、色散等用作神经网络的输出, 通过对神经网络进行训练来实现OAM传输光纤光学特性的预测, 从而优化出具有较高的计算精度和速度, 包括色散和有效折射率差(Δ n eff )的光纤结构. 然后将训练的预测模型与PSO和多目标粒子群优化(multi-objective particle swarm optimization, MOPSO)算法相结合, 分别用于OAM传输光纤的逆向设计. 如 图11 所示, 通过将具有5个传输光纤的结构参数作为输入参数, 2个代表输出异常和正常的光纤模型作为输出端口, 网络结构内涵含两个隐藏层. 通过混合MOPSO-NN算法设计了一种具有极低色散的OAM传输光纤. 该方法可以避免串联神经网络的单解问题, 并根据设计要求输出多个合适的光纤结构, 为具有极致性能的光学结构的逆向设计提供了新的途径. 


▲图11   基于人工智能( AI )的 OAM 光纤设计模型

4.6 遗传算法与DNN的组合优化

遗传算法(genetic algorithm, GA)是计算数学中用于解决最优化问题的一种搜索算法, 是进化算法的一种 [ 80 ] . 进化算法最初是通过借鉴进化生物学中遗传、突变、自然选择及杂交等现象而发展起来的. 该算法在物流系统设计、汽车设计、系统优化设计及电路设计等领域都有广泛应用. 

在微纳光学设计领域中, Ren等 [ 64 ] 创造性地将遗传算法与深度神经网络算法相结合, 实现了基于遗传算法及深度神经网络(genetic-algorithm-based deep neural network, GDNN)的功率分配器、TE模式转换器和宽带功率分配器设计. 在设计工作中, 采用原点位于中心线上的极坐标系, 并使用两组极向量分别离散边界线的顶部([0, π])和底部([π, 2π])部分. 通过平滑地连接这两组极性矢量并组合输入和两个输出端口, 形成了完整的器件结构. 该设计中, 通过使用DNN模型来代替遗传算法的交叉和变异操作. 在正向设计过程中获得给定编码设计参数向量形式的设备品质因数(figure of merit, FOM)和网络权重参数. 获得网络权重参数后逆向设计过程利用与波长相关联的FOM数据作为输入, 以产生相关但不同于父代的子代设备设计. 完全连接的多层DNN与Sigmoid激活函数和反向传播方法一起用于权重更新. 与以往的优化算法相比, GDNN算法更能实现复杂的多约束和多目标优化. 在不依赖预定义几何结构和网格中的像素化特征的情况下, 该方法允许设计更灵活的器件结构, 同时遵守制造设计规则. 与以前基于DNN的逆向设计方法相比, 该算法的遗传进化特性大大提高了计算效率, 并将FDTD训练数据减少了1个数量级. 

4.7 多种优化算法组合使用

相较于神经网络算法通过几万或几十万个神经元数量及漫长的时间来训练AI模型. 线性回归(linear regression, LR) [ 81 ] 、支持向量回归(support vector regression, SVR) [ 82 ] 、KNN [ 83 ] 、随机森林(和森林退化) [ 84 ] 及梯度提升回归(梯度增强回归,GBR) [ 85 ] 等传统机器学习算法因模型结构简单在取得良好模型性能的同时大大减少了模型训练的时间成本, 比如, 当训练一个具有几十万样本的标签向量数据集时, KNN、决策树等机器学习模型只需要几分钟的时间即可完成训练, 而神经网络等算法, 特别是DNN模型可能需要几天时间才能完成模型的训练. 当然, 花费大量训练时间的神经网络模型在面对大型、超大型数据集时往往能够取得更好的性能表现. 但是, 一味地拔高模型精度不是最终的目的, 还需要综合考虑时间、算力等各项成本, 选用合适的设计方案. 

钙钛矿太阳能电池(perovskite solar cells, PSCs)的光伏性能与钙钛矿的组成成分、电池的结构设计、每个传输层的电子特性和制造参数有关, 如此众多的影响因素使得钙钛矿太阳能电池的设计优化变得具有挑战性, 通过传统实验方法进行不断的测试将花费大量的时间与精力. Zhang等 [ 58 ] 提出了一种正反向机器学习框架, 以在备受瞩目的MASn x Pb 1– x I 3 钙钛矿材料建立关键参数与光伏性能之间的关系, 通过混合Sn-Pb实现PSCs光伏性能的优化, 并使用LR, SVR, KNR, RFR, GBR五种算法对所建立的机器学习模型进行反分析. 所建立的AI模型可直接预测最佳的有机金属卤化物钙钛矿组成成分, 通过制作样品验证了预测结果. 

4.8 其他优化算法

在微纳光学设计中, 除了结合现有算法对传统光学设计进行优化之外, 还可以根据设计需求构建专一的优化算法, 例如在亚波长纳米光学器件设计领域, 常见的单模3 dB功率分配器和双模解复用器设计通常采用FDTD或者FEM方法通过参数化扫描的方式, 不断迭代来优化其结构和性能. Wang等 [ 47 ] 提出一种利用伴随法(adjoint method)对“数字”亚波长纳米光学器件进行高效逆向设计的方法. 优化包括三个阶段, 首先“模拟”模式的连续变化, 其次, “准数字”模式的强制介电常数偏置, 最后, 实现多级数字模式. 利用该方法设计的单模3 dB功率分配器, 通过将2.6 μm×2.6 μm的结构面积离散为20×20像素图像用伴随法的输入, 透射率指标作为伴随法输出, 利用数字化优化方法(digitized adjoint method)进行逆向设计, 与简单的暴力方法, 如直接二进制搜索(direct binary search, DBS)算法相比, 该方法可以将设计效率提高约五倍, 性能优化可以达到大致相同的水平. 

05 性能度量

基于AI微纳光学设计的另一个关键问题是性能度量. 目前常用的性能评价指标主要有回归任务中的MSE, RMSE、平均绝对误差(mean absolute error, MAE)、二元交叉熵(binary cross entropy, BCE)及分类任务中常用的准确率、精确率(查准率)、召回率(或称灵敏率)、F1值、受试者工作特征 (receiver operating characteristic, ROC)曲线的曲线下面积 (area under curve, AUC)值等指标. 其中, MSE, RMSE, MAE及BCE计算方法如下: 


06 总结与展望

从简单的平板波导结构, 到反谐振光纤、光耦合器、光分束器设计及钙钛矿太阳能电池、超表面、超材料设计. AI在微纳光学中的应用愈发广泛. 每一次AI在微纳光学领域中的应用都带来了新的启发, 并为相应微纳结构或者光学器件的设计带来新的思路. 如图13所示, 用“见”、“多”、“识”、“广”四个方面来对AI在微纳光学设计中的应用进行总结与展望. 


▲图 13  AI微纳光学设计发展趋势

6.1   “见”

现今智能微纳光学设计AI已经“见”到了等离子体超材料、超表面、光子晶体光纤、手性纳米结构等设计. 然而在微纳光学设计中, 还有许多如等离子体-声子耦合器、光隔离器、电光表面等设计, AI还未能“见”到. 因此, 进一步地将AI应用于更多的光学设计之中, 仍是未来研究工作的重点. 对于同一种耦合器设计, 既可以选择将耦合器的物理结构转换成结构参数向量的方式让AI“见”到, 也可以将其转换为黑白二色像素图像再以像素图像的方式让AI“见”到, 还可以直接以图像的方式来让AI“见”到, 从结构参数向量到结构图像, 让AI模型“见”到的东西变得更加具体, 更加精确. 未来是否有更好的“见”的方式, 能够保证AI模型达到足够精度的同时, 还具有相当的效率, 这将是今后研究工作的一个方向. 

6.2   “多”

在微纳光学设计中, 对于不同的微纳设计对象, 往往需要利用仿真或者实验的方式构建专一的数据集, 这无疑会耗费大量的时间及精力. 因此, 如何构建更多的数据关乎AI模型最终的性能表现. 在构建更多数据的同时, 如何保证数据有效利用也是智能光学设计研究的关键. 俗话说得好: “众人拾柴火焰高”, 在智能光学设计中, 研究数据集的开放共享将是一件惠及所有研究者的事情. 与此同时, 如果能够将数据集的开放与共享规范化、统一化. 那么在未来, 直接利用AI检索这些规范、统一的实验数据, 进而实现智能微纳光学设计的时代将会到来, 这一举措将大大加速现有微纳光学的研究进程. 

6.3   “识”

ANN, CNN及DNN等算法在微纳光学中的成功应用, 为微纳光学设计提供了新的研究思路. 在CNN网络的基础上, 最近提出的YOLOv5对象检测算法[87], 在对特定图像识别过程中, 展现出比R-CNN, Fast R-CNN更快的检测速度. 通过将Inception结构与ResNet结构相结合提出的GoogLeNet inception v4模型相较于前代, 具有更宽的网络深度及更好效果[88], 这些新的AI算法的提出, 虽然还未应用于微纳光学设计, 但也为下一步的研究提供了思路. 

通过调整网络的自由参数来将网络的预测值与实验数据进行紧密匹配的神经网络模型, 在微纳光学设计这个建立在物理公式之上的光学设计成功应用的物理意义在哪里? 这些利用纯数据驱动的神经网络虽然可以在实验数据附近准确地模拟物理过程, 但它无法从训练数据中概括出来. 仅仅依靠这些数据, AI能否真正“理解”科学及这些光学设计模型背后的物理意义? 一种被称为物理信息神经网络(physics-informed neural networks, PINNs)的算法被提出[89,90], 并试图解决这一难题. 相较于传统的神经网络, PINNs在训练时, 通过将已知的微分方程直接添加到损失函数中. 通过把物理方程迭代前后的差值加到神经网络的损失函数里面去, 让物理方程也“参与”到了训练过程. 这样, 神经网络在训练迭代时候优化的不仅仅的网络自己的损失函数, 还有物理方程每次迭代的差, 使得最后训练出来的结果能够满足物理规律. 

Chen等[63]利用PINNs实现了光纤传输模型的建立. 该模型将其视为方程求解问题. 该模型将时间帧和距离帧作为其输入, 并采用nonlinear schrödinger equation (NLSE)解的相应实部和虚部作为其输出, 通过在损耗函数的设计中考虑传输前的脉冲和信号作为初始条件, 以及光纤物理原理(如NLSE), 该模型将逐步学习传输规则, 该模型的基本结构是多层完全连接的神经网络. 存在一个输入层、一个输出层和多个隐藏层. 每个隐藏层有100个神经元. 输入层的神经元表示距离和时间, 而输出层的神经元分别表示NLSE解的实部和虚部. 模型的输入和输出应分别在进入光纤传输模型之前和离开光纤传输模型之后进行归一化和非归一化. 通过对该网络进行训练及优化可以实现在没有数据标签的情况下进行有效训练. 

6.4   “广”

通过将AI技术应用于微纳光学设计, 可以实现空芯反谐振光纤的性能预测、耦合器的结构设计、功率分配器输入端口透射率的预测等等. 但是, AI是如何做出这些预测的? 一些学者将AI所具有的做出这些预测的能力称为科学理解(scientific understanding)[91]. 并将AI辅助科学理解按照功能实现的不同划分为三个维度: 

1)作为一个“计算显微镜”, 它可以提供目前尚且无法通过实验手段获得的信息;

2)作为一个“灵感来源”或人工缪斯, 扩大人类想象力和创造力的范围;

3)人工智能作为“理解主体”, 代替人类对观察结果进行归纳, 并将这些新的科学概念转移到不同的现象中, 而且将这些见解传达给科学家. 

在当前阶段, AI还处于第一和第二阶段, 通过利用AI具有的可以从大量数据中发现客观规律或者从大量数据中找到异常, 就像一个“计算显微镜”一般“明察秋毫”, 来获取人们难以察觉的细小数据变化, 进而从实验或模拟中获得特殊数据点或意外的规律来引发新的想法和概念. 未来AI或许能够自己进行科研的过程, 然后“指导”人们学习. 

在基于AI的光学设计过程中, 相同物理规律指导下的光学设计往往产生相似的结构设计, 通过最近向量距离(ΔLmin)和均值向量距离(ΔLave)2个参数定量描述逆向设计结果的奇异性, 可以表征设计结果对微纳光学材料与器件的结构样本空间研究、获得新知识与新设计方法的启发性. ΔLmin与ΔLave分别定义为光学设计样本空间中设计目标与最近已知结构样本位置与现有已知结构样本位置均值之间的距离, 如图14所示. 


▲图 14  “最近与均值向量距离”度量方法示意图

面对众多的微纳光学设计对象, 对于每一个设计都要进行数据集构建、AI模型设计与训练、性能度量等步骤, 那么有没有一种可能, 将一种微纳光学AI模型设计应用到其他微纳光学设计之中? 一种被称为迁移学习(transfer learning)[92]的技术被提出, 该方法旨在通过转移不同但相关的源域中包含的知识来提高目标学习者在目标域上的表现. 通过这种方式, 可以减少构建目标学习者对大量目标域数据的依赖. 迁移学习还是数据驱动的算法模型, 而表征学习的提出, 则提供一种能够在不预先对系统做出假设的情况下, 从实验数据中利用AI辅助科学发现的能力, 利用这种方法已经实现了一些物理方面的应用. 例如, 通过给定从地球观测到的太阳和火星位置的时间序列, 利用表征学习的方法实现在没有得到任何关于特定物理系统先验信息的情况下, 发现日心说理论[93]. 

微纳光学材料与器件是一个非常具有潜力的研究方向, 相关研究涉及航空航天、电子通信、生物、材料等, AI技术的发展为这些科学技术的研究提供了新的助力, 虽然AI技术的应用已经在相关研究工作中取得了显著的成果, 但还有许多的难题需要广大研究者共同努力攻克. 

Share this on