2023年365英国上市官网在线院
信息技术研究生论坛(十六)
场次一、
时间:2023年7月3日(星期一)9:00-12:00
地点:365英国上市官网在线院807b教室
报告题目一:一种用于检测车联网中新型位置伪造攻击的不当行为检测系统
报告人:孙晗
报告简介:在车联网(IoV)网络中,车辆定期交换包含速度和位置信息的基本安全信息(BSMs)。安全关键应用,如盲点警告和变道警告系统,使用BSM来确保道路使用者的安全。为了在网络中制造混乱,内部攻击者可能会向BSM注入虚假信息,并将其广播给附近的车辆。其中一种攻击是位置伪造攻击,攻击者在BSM中插入关于位置的虚假信息。文献已经探讨了使用不当行为检测系统(MDS)来检测此类攻击。但现有方法的局限性在于,它们要么在特定的环境设置中表现得非常好,要么在有利于广义模型的检测精度上有所妥协。此外,目前所有基于机器学习的检测模型都是基于签名的,这需要事先了解攻击才能有效检测。报告提出了一种用于车联网的新型位置伪造攻击检测系统(NPFADS for the IoV),以学习和检测出现在车联网网络中的新型位置伪造攻击。使用指标精密度、召回率、F1分数、ROC曲线和PR曲线分析NPFADS的性能。车辆参考不良行为(VeReMi)数据集作为研究的基准。该系统的性能与文献中已有的MDS进行了比较。分析表明,即使初始化时对新位置伪造攻击的知识为零,该系统的性能也优于现有的监督学习模型。
报告题目二:自适应尺度融合
报告人:白澳坤
报告简介:近年来,基于分割的场景文本检测方法在场景文本检测领域引起了广泛的关注,因为它们受益于像素级描述,在检测任意形状和极端长宽比的文本实例方面具有优越性。然而,绝大多数现有的基于分割的方法仅限于其复杂的后处理算法和分割模型的规模鲁棒性,其中后处理算法不仅与模型优化隔离,而且耗时且耗时。通常通过直接融合多尺度特征图来增强尺度鲁棒性。因此提出了一种可微分二值化(DB)模块,它将二值化过程(后处理过程中最重要的步骤之一)集成到分割网络中。与所提出的数据库模块一起优化,分割网络可以产生更准确的结果,从而通过简单的管道提高文本检测的准确性。此外,提出了一种高效的自适应尺度融合(ASF)模块,通过自适应地融合不同尺度的特征来提高尺度鲁棒性。通过将所提出的 DB 和 ASF 与分割网络相结合,提出的场景文本检测器在五个标准基准测试中在检测精度和速度方面始终达到最先进的结果。
报告题目三:基于BERT的COVID-19流行病学调查信息的中文命名实体识别
报告人:林云杰
报告简介:命名实体识别就是从非结构化的输入文本中抽取出一系列实体,即具有特定意义的实体,包括人名、地名、机构名、专有名词等,并且可以按照业务需求识别出更多类别的实体。基于COVID-19流行病学调查信息的命名实体识别有助于分析疫情的来源和传播途径,更好地控制疫情的传播。本次报告主要介绍中文命名实体识别模型BERT-BiLSTMIDCNN-ELU-CRF(BBIEC),该模型首先将未标注的COVID-19流行病学调查信息处理成字符级语料,并根据BIOES字符级标注系统进行人工实体标注,然后使用BERT预训练模型得到词向量位置信息;然后,通过双向长短期记忆神经网络(BiLSTM)和改进的迭代扩张卷积神经网络(IDCNN)从生成的词向量中提取全局上下文和局部特征并将它们串联起来;将所有可能的标签序列输出到条件随机场(CRF);最后通过条件随机场解码生成实体标签序列。该模型在识别COVID-19流行病学调查信息的实体方面优于其他传统模型,能有效的识别出流行病学调查信息中的一系列命名实体。
报告题目四:基于覆盖率的模糊测试的历史驱动突变
报告人:杨婵娟
报告简介:基于突变的模糊测试是发现程序中漏洞的最流行方法之一。为了缓解突变过程中高随机性导致的基于突变的模糊测试效率低下的问题,近年来开发了多种解决方案,特别是基于覆盖的模糊测试。它们主要采用自适应突变策略或集成约束求解技术来很好地探索触发独特路径和崩溃的测试用例。然而,他们缺乏对模糊测试历史的细粒度重用来构建这些有趣的测试用例,即他们在很大程度上未能在不同的模糊测试中正确利用模糊测试历史。事实上,模糊测试历史中的测试用例包含有关关键突变策略的丰富知识,这些策略导致发现独特的路径和崩溃。具体来说,这些突变策略中隐含的部分路径约束解决方案可以重用于加速发现共享类似部分路径约束的新路径和崩溃。
因此,报告首先提出了一种轻量级高效的概率字节定向模型(PBOM),该模型从试验内和试验间的历史中正确捕获字节级突变策略,从而可以有效地触发独特的路径和崩溃。然后,提出了一个名为EMS的新型历史驱动突变框架,该框架使用PBOM作为突变算子之一,根据输入的突变字节值概率地提供所需的突变字节值。报告在9个现实世界的程序中根据最先进的模糊器(包括AFL、QSYM、MOPT、MOPT-dict、EcoFuzz和AFL++)评估EMS。结果表明,EMS发现的独特漏洞比基线多4.91倍,并且在大多数程序中发现的线路覆盖率高于其他模糊器。
报告题目五:一种基于深度学习的漏洞检测方法
报告人:庞飔
报告简介:传统的漏洞研究方法往往要求安全研究人员具备专业知识和丰富的实践经验、通用性较差、效率有限、成本高、高误报率以及高漏报率等问题,已无法满足复杂软件的安全性分析需求。随着人工智能产业的兴起,大量机器学习,数据挖掘的方法被尝试用于解决软件漏洞挖掘问题。基于机器学习的软件漏洞挖掘模型主要对数据表征模块中的代码表征形式与编码模型、模型训练模块中的机器学习模型进行改进,使得其成本、效率和准确率更高。报告提出一种新的混合cnn-lstm方法,该方法由CNN和RNN的复合神经网络组成,可增强漏洞检测。使用卷积神经网络从代码度量中提取特征,然后使用长期短期记忆网络 (cnn ‐ lstm) 来检测代码度量中的漏洞。
报告题目六:基于深度密度聚类的宏基因组DNA重叠群分类算法
报告人:石家彬
报告简介:宏基因组是从生物环境的样本中直接获得的DNA序列数据。宏基因组测序技术只能获得短序列,大多数方法首先将短序列组装成更长的重叠群,然后对得到的重叠群进行聚类。基于宏基因组测序序列,将组成相似或丰度一致的重叠群聚类到同一物种称为重叠群分箱。现有的重叠群宏基因组学分箱方法主要可分为三类:基于组成、基于丰度和基于组成和丰度。基于深度密度聚类的宏基因组 DNA 重叠群分类算法对于目前 DNA 重叠群分类问题所存在的一些重点和难点方面进行了如下研究:(1)宏基因组 DNA 重叠群 k-mer 频率特征提取;(2)构建一种基于重叠群长度特征加权的 VAE特征学习模型;(3)提出一种基于深度密度聚类的宏基因组重叠群分类策略。
报告题目七:VAMB:使用深度变分自动编码器改进宏基因组分箱和组装
报告人:符龙
报告简介:尽管宏基因组分类最近取得了进展,但从宏基因组数据重建微生物物种仍然具有挑战性。在这里,开发了用于宏基因组分箱的变分自动编码器(VAMB),该程序使用深度变分自动编码器在聚类之前对序列共丰度和k-mer分布信息进行编码。变分自动编码器能够集成这两种不同的数据类型,而无需事先了解数据集。VAMB的性能优于现有的最先进的binner,在模拟和真实数据上分别重建了29-98%和45%的接近完整(NC)基因组。此外,VAMB能够分离出平均核苷酸同一性(ANI)高达99.5%的密切相关菌株,并从1,000个人类肠道微生物组样本的数据集中将255个和91个NC普通拟杆菌和多雷拟杆菌样本特异性基因组重建为两个不同的簇。使用该数据集中的2,606个NCbin来显示人类肠道微生物组的物种具有不同的地理分布模式。
场次二、
时间:2023年7月03日(星期一)15:00-18:00
地点:365英国上市官网在线院807b教室
报告题目一:基于用户交互的半自动图像分割
报告人:黄秋凯
报告简介:图像分割是许多视觉理解系统的重要组成部分。它涉及到将图像(或视频帧)划分为多个段或对象。分割在广泛的应用中起着核心作用,包括医学图像分析(如肿瘤边界提取和组织体积测量)、自动驾驶汽车(如导航表面和行人检测)、视频监控和增强现实。交互式图像分割又称为辅助分割或半自动图像分割,指利用用户的交互提供先验信息,从背景中提取图像区域或感兴趣的对象的任务。交互通常分为基于scribble的交互、基于bounding box的交互和基于click的交互,允许用户提供良好的约束(大小、颜色、位置、目标等)来指导分割过程。与自动分割方法相比,这可以提高结果,并减少运行时间。事实上,许多计算机视觉应用程序(医学成像、图像编辑、目标识别和目标跟踪)需要这样的用户干预来获得准确的分割结果,然后将其用作其他高级处理的输入。
报告题目二:基于自适应卡尔曼滤波的多目标跟踪方法
报告人:郑力文
报告简介:报告主要介绍在多目标跟踪(Multiple Object Tracking, MOT)领域,传统MOT方法存在对不规则运动的目标进行跟踪时效果较差的问题,所提出基于自适应卡尔曼滤波的多目标跟踪方法能够较好地解决。并探讨其与传统MOT方法的不同之处。然后采用所提方法及传统MOT方法在公共数据集MOT17、MOT20、DanceTrack上进行实验验证,并使用一些标准的性能指标进行评估。最后,探讨对多目标跟踪方法进行轻量化处理,以利于工业化部署。
报告题目三:基于扩散模型的语义分割研究
报告人:郭行文
报告简介:扩散模型作为最新的生成式模型,能够生成具有高多样性和高合成质量的图像。除了图像生成,扩散模型已经成功应用在其他视觉任务中,包括图像修复、语义分割、异常检测等。语义分割的目的是将图像中的像素划分为不同的语义类别,一般的扩散模型分割针对图像掩码,在前向加噪过程中对掩码加入噪声形成噪声图像,在去噪过程中去除噪声,通过迭代最终完成对图像的分割。原始图片通常作为条件变量在去噪过程中辅助模型生成分割图像。基于扩散模型的语义分割存在的挑战是由于需要许多迭代去噪步数来从高斯噪声中生成分割,导致分割效率很低。
通过寻找更好的迭代方案,提高模型的分割效果。
报告题目四:一种简单、高效的轻量级神经网络
报告人:蒋浩东
报告简介:为了设计轻量级卷积神经网络,先前的工作(例如,MobileNetv1,MobileNetv2,ShuffleNetv1)都集中在降低FLOPs,然而FLOPs只能间接衡量网络的推理速度(延迟),FLOPs的减少不一定就使得网络的推理速度提高,这主要是因为网络的推理速度不仅和FLOPs有关,还和FLOPs有关。为了避免深度可分离卷积频繁访问内存造成低FLOPs的缺点,有研究者提出了部分卷积并在此基础上构建了FasterNet。实验表明,它在各种设备上实现了比其他轻量级神经网络更高的运行速度且并未影响在多种视觉任务中的准确性。
报告题目五:基于元学习的小样本语义分割研究
报告人:刘冠霆
报告简介:传统的有监督语义分割方法可以在经过大规模有监督数据集训练后达到较好的分割效果。然而,有监督语义分割算法存在两个难点:1. 依赖大量高质量有标记数据2.泛化性能不足。为了应对这两个问题,小样本语义分割方法被提出。小样本语义分割方法借鉴元学习(meta-learning)思想,即让机器能够像人一样“学会如何学习(learn to learn)”的思想,通过精心设计训练任务、模型结构和损失函数,达到仅使用少量有标注的训练样本就可以对新的未标注的图像语义类别预测的目的。小样本语义分割可以在减轻图像数据标注工作量的同时提高模型的泛化能力,从而摆脱深度学习对大规模、有标注数据集的依赖。本报告主要介绍小样本语义分割的主流模型。
报告题目六:基于深度学习的半监督目标检测算法研究
报告人:农甘骁
报告简介:为了寻找数据效率更高的深度学习方法来克服全监督目标检测对大型注释数据集的需求,半监督目标检测被提出。它通过探索大量易于获得的未标记图像,在有限的监督下学习图像的特征表示,以减少所需的标记数据量。通过开发新方法或采用现有的半监督学习框架进行半监督目标检测,目前主流的半监督目标检测策略主要是基于伪标签的方法和基于一致性正则的方法。相比于完全依赖有标注数据的目标检测,半监督目标检测能够更充分地利用未标注数据,通过引入更多的信息从而提高模型的泛化能力和性能。
报告题目七:基于TFA的小样本目标检测
报告人:廖海坤
报告简介:在过去的几年里,我们可以看到大多数机器学习(ML)领域的范式转变。传统的预测方法是依靠手工提取特定于用户和网络的特征。而如今这种手工的方式大多数已经被端到端框架所取代,在端到端框架中,从输入到输出的映射与输入的最方便表示一起学习。这些模型通常具有分层架构,其中较深的层在从先前层获得的较简单表示中表达的较复杂表示上操作。然而,这些模型的深度是有代价的:它们的表达性需要广泛的假设空间,这反过来就要大量的数据来学习可靠的假设。事实上,在有限的数据集上训练这些模型可能会导致问题的过拟合表示,这也包括非信息特征。这些特征出现在数据集中,但不代表样本的总体分布。为了弥合当前机器学习模型和人类智能之间的差距,小样本学习(FSL)旨在设计能够在有限数据范围内成功运行的模型。与人类类似,小样本模型必须利用某种先验知识才能学习可靠的假设。虽然任何深度检测器都可以集成到框架中,但在这项工作中使用了Faster R-CNN。在后者中,主干网络和RPN特征可以被认为是类不可知的,因此从base类学习的特征很可能被转移到novel类而无需微调。相反,由框预测器学习的表示是类特定的。它们不会从base类转移到novel类,需要在novel类上进行微调。而微调(TFA)框架显示了一个二阶段的方法。在前者中,模型仅在具有Faster R-CNN损失函数的base类上进行训练。在第二阶段中,框预测器在包含base类和novel类的平衡训练集上进行微调。这些预测器是随机初始化的。使用相同的损失函数,但具有较小的学习率。这种选择应该减少分类器遇到的类内方差,从而减轻从base类到novel类的检测准确性的损失。
场次三、
时间:2023年7月3日(星期一)16:30-18:30
地点:365英国上市官网在线院509教室
报告题目一:基于逆向设计的多模弯曲波导
报告人:陈悦
报告简介:光波导是连接光子集成电路(pic)中各种器件的基本元件,用于光计算、通信、传感等领域。小尺寸、高性能的多模波导弯曲(MWB)对于片上光器件集成具有重要意义。多模波导承载来自不同用户的信息,具有多个引导模式,以增加光互连的带宽。然而,随着这些多模波导的应用提高了带宽,集成系统的尺寸也可以急剧扩大,因为多模波导弯曲比单模波导弯曲半径大得多。多模波导弯管(MWBs)的设计方法应重新考虑,以缩小其有效尺寸,以实现系统小型化。所选择的研究方法是,90°弯曲的轨迹被分成两个对称的半部分,这两个半部分相对于45°的对称轴是彼此的镜像,每个半部分被分割成小的弯曲部分。每个截面的弯曲半径和波导宽度是使用优化算法确定的参数。
报告题目二:基于深度学习的ARPES光谱降噪
报告人:谢松霖
报告简介:机器学习技术在去除图像中噪声方面的性能远远超过了传统的图像处理方法。然而,基于机器学习的图像处理的应用大多局限于非科学目的。鉴于光谱实验中神经网络的去噪性能优异,而数据采集时间有限,引入基于机器学习的去噪技术,将对光谱实验数据的采集和分析产生重大影响。最近的研究表明,机器学习在光谱数据特征提取、自能分析、x射线结构精细、超声波光谱学等方面的成功应用。这些例子表明,机器学习在凝聚态物理中也是一个有用的工具。因此使用深度学习消除ARPES光谱的噪声,这对于节省测量时间和提高光谱质量非常有帮助。
报告题目三:基于联邦强化学习的计算任务卸载
报告人:张贵和
报告简介: 在空天地一体化网络中,针对本地IoT设备计算资源不足和电池限制的问题,利用无人机将IoT设备上的计算密集型应用卸载到基站上的边缘服务器或者云端的数据中心完成再返回计算结果,使得IoT设备完成任务的能源和时间延迟之和最小。但是随着而来的是计算任务卸载策略的问题,可以将计算任务卸载表示为马尔可夫问题,再利用深度强化学习来解决。但是在为每个设备单独训练强化学习模型,会导致训练时间长和大量的资源浪费。因此可以将联邦学习与深度强化学习相结合,个体在本地训练共享的深度强化学习模型,联邦学习的系统操作员在聚合所有更新的局部参数之后更新全局模型进而加快模型收敛速度。
报告题目四:超透镜设计
报告人:何绮宁
报告简介:自由调控电磁波(光)一直是人类的梦想和追求,这不仅具有重要的科学意义,而且在信息、国防、能源等领域有着广泛的应用价值。超构材料的电磁响应可以按照工程的需要进行设计,由此实现了自然材料所不能实现的一系列电磁波调控现象,为自由调控电磁波提供了有效的手段。随着超构材料的发展,二维超构表面开始成为研究的主流方向。这得益于超构表面可在亚波长尺度内实现对相位、振幅和偏振等的灵活设计,并且兼具平面化和低损耗的优点。在众多超构表面的应用中,光学超构透镜是其中非常重要的一类。它的出现为减轻传统光学系统负荷、实现光学系统集成化以及实现新功能提供了有效的技术途径。超构透镜可以同时独立地调控光的相位、振幅、偏振等,不仅可以对单波长电磁波进行调控,还可以对一定光谱范围电磁波的波长色散进行调控。因此,超构透镜比同样是平面结构的传统衍射透镜拥有更大的潜力。