2023年365英国上市官网在线院
信息技术研究生论坛(十四)
场次一、
时间:2023年6月26日(星期一)9:00-12:00
地点:365英国上市官网在线院807b教室
报告题目一:一种高效并行的印章文字检测识别
报告人:白澳坤
报告简介:在中文印章场景文本识别中,由于存在印章文字弯曲排列、模糊、遮挡等现象,加之真实场景数据集缺乏,给印章文本识别带来巨大的挑战。目前办公场景中对中文印章的文字识别主要依靠人力,效率非常低。为解决上述问题,针对文本区域检测与文本识别两阶段,分别改进可微二值化检测算法(DBnet)和卷积递归神经网络识别算法(CRNN),构建基于 DB-ECA 的检测模型和基于 CRNN-Infer 的识别模型。将高效通道注意力模块加入可微二值化网络,解决特征金字塔冲突,并改进卷积层网络结构,推迟下采样来减少语义特征丢失。识别模型使用以自注意力为基础的推理层代替循环层,解决循环神经网络只能单向串行传输的限制,并行预测特征序列的标签分布。用该模型在自制的数据集上进行实验,在不需要复杂的预处理操作的情况下,对中文印章的文字识别精确率达到 91.29%,充分了说明该模型的有效性。
报告题目二:一种通过字形和拼音信息加强的中文预训练模型
报告人:林云杰
报告简介:自Bert以来,大规模预训练模型已成为自然语言处理研究的一大重点,无论是训练更大的模型,还是改变预训练方法,关于预训练模型的前沿研究从未停滞。不同于英文字母,中文的字形和拼音都有其独特的含义,例如“液”、“河”和“湖”都有相同的偏旁,其含义也有联系;中文汉字“乐”是一个多音字,读“yue”时代表音乐,读“le”时便代表快乐的意思。ChineseBERT预训练模型从汉字本身的这两大特性出发,将汉字的字形与拼音信息融入到中文语料的预训练过程。一个汉字的字形向量由多个不同的字体形成,而拼音向量则由对应的罗马化的拼音字符序列得到。二者与字向量一起进行融合,得到最终的融合向量,作为预训练模型的输入。模型使用全词掩码和字掩码两种策略训练,使模型更加综合地建立汉字、字形、读音与上下文之间的联系。
报告题目三:灰盒模糊测试中的自适应多目标优化研究
报告人:杨婵娟
报告简介:覆盖引导灰盒模糊测试(CGF)是一种高效的软件测试技术。CGF 中通常有多个目标需要优化。然而,现有的CGF方法无法同时成功地找到多个物镜的最佳值。报告提出了一种用于多目标优化(MOO)的灰盒模糊器,称为MobFuzz:将多目标优化过程建模为多玩家多臂老虎机(MPMAB)。首先,它自适应地选择包含最适合当前情况的目标的目标组合。其次,MobFuzz的模型处理功率时间表,它在选定的目标组合下自适应地将能量分配给种子。在MobFuzz中,提出了一种称为NIC的进化算法,以同时优化我们选择的目标,而不会产生额外的性能开销。为了证明MobFuzz的有效性,对12个真实世界的程序和MAGMA数据集进行了实验。实验结果表明,MobFuzz中的多目标优化优于基线模糊器中的单目标模糊测试。与它们相比,MobFuzz可以选择最佳物镜组合,并将多个物镜的值提高到107%,能耗最多可降低55%。此外,MobFuzz的程序覆盖率提高了6%,并且发现的独特错误比基线模糊器多3倍。NIC算法至少提高了2倍,性能开销约为3%。
报告题目四:基于信任和优先级的无人机辅助车联网的路由和移动及面向服务的解决方案
报告人:孙晗
报告简介:无人机辅助解决方案是一个要求很高且很受欢迎的研究领域,无人机可以从地面网络发送或收集数据。近年来,由于快速增长和新的数据传输架构,车联网网络出现了拥塞问题。该领域的数据通信可以使用车辆节点实现。由于节点的独特特性和高移动性,动态拓扑、不可预测的网络模式和其他障碍降低了这些网络的性能,并导致断开、延迟和数据包丢失问题。报告提出了一种基于信任和优先级的无人机辅助车联网(TPDA-IoV)解决方案,用于车联网中车辆节点和无人机之间的数据路由。该方案基于无人机对无人机(D2D)和无人机对车辆(D2V)数据通信和信任评估三个模块。该解决方案特别适用于IoV网络出现拥塞问题,地面基站由于拥挤的交通模式和人口密集的城市道路以及有限的基础设施设置而无法处理从车辆节点接收到的所有通信的情况。消息需要紧急决策服务,以避免网络中的任何严重问题。建议的解决方案提供无人机辅助资源,通过使用从基站接收到的交通密度信息来收集或发送数据。这种解决方案是拥塞网络的最佳选择,在这种网络中,由于设备上的密度和负载,通道无法传输数据。提出的解决方案还通过选择无人机之间最优的能量水平来解决无人机电池有限的问题。该解决方案在包传递比、网络开销和端到端延迟方面与最新的解决方案进行了测试。与现有的解决方案相比,提出的解决方案实现了较高的性能。
报告题目五:BMC3C:使用密码子、序列特征和覆盖度对宏基因组重叠群分箱
报告人:符龙
报告简介:宏基因组学直接从环境样品中获取全部微生物的DNA,无需经历人工纯培养阶段,在微生物的研究中发挥了不可替代的作用,给微生物领域的研究带来了新的发现。随着下一代测序技术的快速发展,宏基因组数据量越来越大,宏基因组分类也越来越困难。宏基因组分类直接影响着宏基因学后续的研究,因而如何高效地从这些数据中对DNA序列进行分类,已经成为了宏基因组学相关研究中的关键问题。针对无监督的宏基因组分类问题,提出了一种基于集成k-means与图分割的宏基因组分类方法--BMC3C,并探索引入了一种全新的特征--密码子使用模式。BMC3C首先自动地探索聚类个数,并利用不同的初始化信息重复地执行多次k-means对序列进行多次聚类。然后根据这些聚类结果构建一个权重图,其中每一个节点代表一个序列,而节点之间的权重代表聚类结果中两个序列之间的关联性。如果两条序列频繁地被聚类到一个类簇中,那么它们之间的权重就大,反之则小。最后,BMC3C利用图分割的方法将权重图分割为多个子图,每一个子图代表一个类。在模拟数据集以及真实数据集上的实验结果显示,BMC3C的实验效果显著好于其他对比算法。BMC3C是第一次将密码子使用模式与集成聚类引入无监督宏基因组分类,实验验证了集成算法在BMC3C中的有效性,同时实验还探究并且验证了新引入的密码子特征在宏基因组分类中的有效性。
报告题目六:基于计算机视觉的车道线检测技术研究
报告人:石家彬
报告简介:随着智能交通的发展,近年来,智能辅助驾驶技术已成为研究热点,而车道线检测是智能辅助驾驶的一项基本任务。准确识别车道线的位置能为车辆安全行驶提供重要信息,因此,研究车道线检测具有重要的现实价值。基于计算机视觉的车道线检测首先从视觉传感器中提取图像并输入车道线检测系统;其次对图像进行预处理,包括图像去噪、数据增强、光照效果处理、感兴趣区域选取等;然后对选择的感兴趣区域进行特征提取,特征提取涉及车道线的颜色、纹理、边缘、方向、曲率、车道线与路面的对比度等特征;最后进行车道线检测,从图像中检测线段,将检测到的线段分为左侧车道线、右侧车道线,或非车道线,利用车道线检测实现对实际车道位置的估计。
报告题目七:一种高效的gpu上的并行安全机器学习框架
报告人:庞飔
报告简介:随着机器学习在我们的日常生活中被广泛地应用,大量的数据不断产生并传输到云端进行模型训练和数据处理,安全机器学习或机器学习中的安全性越来越重要,因为目前的大规模机器学习任务通常在HPC服务器上进行,可以由第三方提供。目前,多方计算已广泛应用于机器学习,与差异隐私在原始数据中插入干扰数据不同,多方计算将原始数据集分成几个包含部分数据的加密副本,然后将这些加密副本分发到不同的服务器上。以前关于安全机器学习的工作主要集中在新的协议或提高准确性上,而性能指标却被忽略了。在本文中,我们提出了一个基于gpu的框架ParSecureML来提高基于双方计算的安全机器学习算法的性能。
场次二、
时间:2023年6月26日(星期一)16:10-18:00
地点:365英国上市官网在线院601教室
报告题目一:轻量级单目3D目标检测算法研究
报告人:浦斌
报告简介:单目3D目标检测的主要问题是实例深度估计不准,而这个不准主要表现为远处实例深度估计不准。近处目标的实例深度估计准确,而对于近处目标检测车辆应当需要更快的检测器以便检测未知危险。而现今基于直接回归的单目3D目标检测器普遍在25FPS左右,能在长距离上满足实时性的需求,而对于近处车辆感知的推理速度仍然不足,为此有必要研究轻量级的单目3D目标检测算法以用于对近处目标的快速处理。
报告题目二:基于深度学习的单目深度估计研究
报告人:李林珂
报告简介:单目深度估计是计算机视觉任务,它根据给定的输入图像预测相应的深度图。基于有监督的单目深度估计方法基于深度图的地面真值,在模型训练时需要依赖真实深度依赖庞大的数据进行网络模型的训练,而网络模型的训练需要依赖真实深度值。真实深度值的获取成本高昂,且范围有限,需要精密的深度测量设备和移动平台采集的原始深度标签通常是稀疏点,不能与原图很好的匹配。基于无监督的单目深度估计是一种不需要地面真实值进行训练的方法,近年来引起了人们的关注。设计轻量级但有效的模型,以便它们可以部署在边缘设备上,这是单目深度估计的主要任务。
报告题目三:恶劣天气下的目标检测研究
报告人:梁馨予
报告简介:尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果,但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测的任务,要么经常忽略对检测有益的潜在信息。为了缓解这个问题,有研究者提出了一种新颖的图像自适应YOLO (IA-YOLO) 框架,其中每个图像都可以自适应增强以获得更好的检测性能。
报告题目四:基于深度学习的图像重建方法研究
报告人:吴宇琴
报告简介:近年来,由于基于深度学习的方法比基于滤波、基于模型和传统的基于学习的方法获得了更有前景的去噪结果,它们已成为主流方法。其中卷积神经网络(convolutional neural networks, CNNs)在从大规模数据中学习可推广的图像先验方面表现良好,这些模型被广泛应用于图像重建和相关任务中。最近,另一类神经网络架构transformer在自然语言和高级视觉任务上表现出了显著的性能提升。
场次三、
时间:2023年6月27日(星期二)15:00-17:00
地点:365英国上市官网在线院601教室
报告题目一:基于射频信号的人类活动识别
报告人:罗澍宇
报告简介:相比于传统的基于视觉或者基于可穿戴传感器的方式,无线感知得益于其保护隐私、无接触、能感知微小生理信号以及不受光照、遮挡等影响的优良特性而受到工业界和学术界的广泛关注。如今,无线感知技术已成为许多人机交互场景的关键性技术,在医疗、养老、人机交互等领域得到了广泛的应用。本次报告将介绍基于无线射频信号的人体活动识别基本方法以及当前面临的挑战。
报告题目二:基于多模态医学图像的多任务智能诊断模型研究
报告人:邱俊铼
报告简介:多模态医学图像融合是近年来人工智能研究的重点,多模态数据往往具有互补性,由于看待事物的角度不同,得到的信息也会有所不同,单一角度得到的信息通常具有一定的局限性,但是将多个角度得到的互补信息相融合,往往就能得到相对全面的信息。同时,对医学图像数据的分割、分类和预后,虽然是不同的任务,但却具有相通之处,有可以共享的信息,多任务之间可以相互促进。本次报告将介绍基于多模态医学图像的多任务智能诊断模型,并与目前已有的一些图像处理算法进行比较,对不同的数据融合方式和多任务学习思路进行探讨。
报告题目三:基于增强型多通道图卷积的方面情感三元组抽取方法研究
报告人:谢泽
报告简介:方面级情感分析(Aspect-based Sentiment Analysis, ABSA)是一项细粒度的情感分析任务,主要针对句子级别的文本,分析文本中相关的方面项(Aspect Term)、观点项(Opinion Term)、方面类别(Aspect Category)和情感极性(Sentiment Polarity),在不同的场景下对应着不同的子任务。方面情感三元提取(Aspect Sentiment Triplet Extraction ,ASTE) 是Aspect-based Sentiment Analysis (ABSA) 的一个新变体,旨在从句子中提取方面情感三元组,构建情感知识图谱,每个三元组包含三个元素,即方面词、观点词及其情感极性。本报告将对解决该任务的四种主流范式进行探讨,并介绍一种基于增强型多通道图卷积的方面情感三元组抽取方法。