2025年第14卷第1期文章目次

2025, 14(1):1-8. DOI: 10.12146/j.issn.2095-3135.20241215001

摘要 (324) HTML (0) PDF 596.56 K (616) 评论 (0) 收藏

摘要:主流的人工智能技术从一个侧面可以看成是“智能计算技术”。该文针对智能计算技术取得的历史性突破、发展趋势和面临的挑战发表一些看法；对规模定律(scaling law)是否遇到天花板、解决算力短缺问题的出路在哪里、大模型的本质是什么等普遍关心的问题作简要的综述。

文本引导视频预测大模型的场景动态控制综述

吴福祥，程俊

2025, 14(1):9-24. DOI: 10.12146/j.issn.2095-3135.20241201002

摘要 (569) HTML (0) PDF 14.45 M (1035) 评论 (0) 收藏

摘要:近年来，生成式人工智能的快速发展使文本驱动的视频预测大模型成为学术界和工业界的研究热点。视频预测生成需处理时间维度的动态性和一致性，要求精准控制场景结构、主体行为、相机运动和语义表达。当前的主要挑战是如何精确控制视频预测中的场景动态，以实现高质量和语义一致的输出。针对此问题，一些研究者提出了相机控制增强、参考视频控制、语义一致性增强和主体特征控制增强等方法，旨在提升视频预测的生成质量，确保生成内容既符合历史条件，又满足用户需求。该文系统探讨了上述 4 个控制方法的核心思想、优缺点和未来发展方向。

基于领域自适应预训练的黑暗场景下行为识别研究

许清林，乔宇，王亚立

2025, 14(1):25-38. DOI: 10.12146/j.issn.2095-3135.20231225001

摘要 (622) HTML (0) PDF 5.12 M (3421) 评论 (0) 收藏

摘要:黑暗场景与传统预训练模型所使用的数据之间的域差距导致传统的预训练-微调策略难以达到理想效果，而从头开始的预训练则代价高昂。针对此问题，该研究提出一种领域自适应预训练方法，旨在改善黑暗场景下的行为识别性能。该方法通过融合外部视觉去暗增强模型，引入关键的去暗知识，并利用跨领域自蒸馏框架优化预训练模型，可有效减小明暗场景间视觉表征的域差异。在一系列黑暗场景行为识别实验中，该方法在全监督的黑暗场景行为识别数据集中的准确率达 97.19%；在无源领域自适应场景数据集中的准确率提升至 49.11%；而在多源领域自适应场景数据集中的准确率达54.63%。

小型单关节机器鱼设计与游动稳定性分析

谢智钧，赵灿明，柯鑫，肖扬，武静，宋加雷

2025, 14(1):39-49. DOI: 10.12146/j.issn.2095-3135.20240312002

摘要 (591) HTML (0) PDF 13.18 M (3707) 评论 (0) 收藏

摘要:该文基于鲹科鱼的推进模式和鱼鳍模块化设计了一款结构紧凑、成本低廉、高效游动的小型单关节仿生机器鱼，其胸鳍、腹鳍和尾鳍拆装方便。此外，该文对仿生机器鱼的直线推进、静止转弯、鱼头稳定性进行了水下实验，研究了胸鳍和腹鳍对游动性能的影响。在样机游动测试中，该文利用一台高速相机和一面平面镜构建了一个记录机器鱼运动的“双目视觉系统”，可对鱼头最前端和质点上方两处标记点进行追踪，并可记录三维位置信息，这为机器鱼的游动性能、姿态变化和头部稳定性的定量分析提供参考。结果表明：机器鱼的直线推进和转弯性能较好；在稳定性实验中，配备胸鳍和腹鳍的机器鱼在低频游动时，头部稳定性更优，而在高频游动时，未显示出优势，这与自然界中鱼类在高频游动时除尾鳍外的各种鳍紧贴身体的现象一致。

基于点云投影的工业零部件边缘三维重建算法

张铭凯，谷飞飞，肖振中，师少光

2025, 14(1):50-64. DOI: 10.12146/j.issn.2095-3135.20240820001

摘要 (347) HTML (0) PDF 12.37 M (1003) 评论 (0) 收藏

摘要:工业零部件边缘的精确重建是视觉定位和质量检测的前提和关键。针对工业零部件边缘处的点云难以精确重建的问题，该文提出一种基于点云投影的边缘三维重建算法。首先，通过双目结构光方法扫描得到零部件三维点云，提取扫描点云中的边缘点；其次，在双目图像中提取图像边缘点；再次，将点云边缘点投影到双目图像，在投影边缘点附近搜索最近邻的图像边缘点，匹配得到对应双目边缘点；最后，通过立体视觉方法重建精确的三维边缘点云。实验结果表明：与当前其他方法相比，该方法可有效解决反光、表面划痕等干扰导致的伪边缘问题，重建误差小于 0.15 mm，可用于机器人上下料、在线质量检测等工业场景。

基于内窥镜图像的儿童腺样体场景三维重建

许涛，王顺成，钟建文，刘大波，周宜龙，刘畅

2025, 14(1):65-77. DOI: 10.12146/j.issn.2095-3135.20240307001

摘要 (593) HTML (0) PDF 13.29 M (3567) 评论 (0) 收藏

摘要:腺样体肥大是导致儿童阻塞性睡眠呼吸暂停综合征的主要因素。医生通过内窥镜影像评估腺样体肥大程度及其对气道的阻塞程度。然而，内窥镜影像为二维图像，医生只能主观推测患者腺样体区域的三维结构。这种方法严重依赖医生的相关经验和对腺样体的观察角度。腺样体表面为人体黏膜组织，覆盖鼻腔分泌物，其内窥镜影像具有强反光、特征稀少、场景光滑、模糊等特点。根据腺样体表面特点，该文提出一种基于腺样体鼻咽腔内镜图像序列的多视图三维重建算法。算法首先采用多视图立体匹配技术获取图像对应深度图的粗糙估计；其次，使用网格曲面在深度空间中对粗糙的深度信息进行拟合，从而得到平滑、精细的深度图；最后，通过点云融合算法获得腺样体区域稠密、精确的三维重建。仿真与真实实验表明，该文算法基于腺样体内窥镜图像序列，可实现精确、稠密、平滑的腺样体区域三维重建，且重建结果显著优于现有三维重建算法。

基于文本增强的眼底图像多病种识别方法

熊绍奎，陈世峰

2025, 14(1):78-90. DOI: 10.12146/j.issn.2095-3135.20240422001

摘要 (617) HTML (0) PDF 10.48 M (3101) 评论 (0) 收藏

摘要:该研究在眼科图像疾病识别中引入了视觉语言模型，提出了一种基于对比语言图像预训练模型的多疾病识别算法。首先，作者基于多个公开可用的眼底图像数据集构建了一个含有 8 个类别的多标签眼底图像数据集 MDFCD8；其次，作者利用生成式人工智能 GPT-4(Generative Pre-trained Transformer 4) 生成描述眼底图像细粒度病理特征的专家知识，解决了眼底图像数据集文本标签缺乏的问题；最后，作者计算了平均精度、F1 评分和受试者工作特征曲线下面积，并以三者的均值作为最终的性能评价指标。实验结果表明，与传统的卷积神经网络和 Transformer 网络相比，作者提出的方法在性能上分别高出 4.8% 和 3.2%。同时，作者还进行了各模块的消融实验，验证了该方法的有效性，表明了视觉语言模型在眼科疾病辅助诊断领域的应用潜力。

基于积层胶膜材料封装基板的信号损耗研究

孔维坤，钟诚，陈文博，于淑会，孙蓉

2025, 14(1):91-104. DOI: 10.12146/j.issn.2095-3135.20240119001

摘要 (572) HTML (0) PDF 6.66 M (2678) 评论 (0) 收藏

摘要:随着摩尔定律逐渐逼近其物理极限，下一代集成电路技术的发展面临前所未有的挑战，不仅技术难度陡增，成本也呈急剧上升趋势。在此背景下，先进的封装基板作为支持系统集成和巨量 I/O 提升的重要载体，成为后摩尔时代的核心部件之一。基于积层绝缘胶膜(build-up film，BF)材料的半加成工艺是实现细间距多层封装基板的主要途径之一。由于电子设备在高频高速运行环境中的信号完整性面临严峻挑战，因此该文着重探讨了 BF 材料的物理性能和结构特征对信号传输损耗的影响，并基于微带线和过孔等典型基板结构，通过电学仿真分析系统研究了 BF 材料参数与信号传输性能之间的关系。研究表明：在微带线结构中，信号传输损耗随频率的增加而增大，且这一损耗与 BF 材料的介电损耗因子密切相关；而在过孔结构中，BF 材料的介电常数显著影响等效电容和阻抗值，进而影响阻抗的不匹配度。BF 材料的特性虽然对阻抗不匹配有一定影响，但过孔结构本身的设计仍是影响阻抗匹配度的主要因素。此外，高频下导体趋肤效应导致的导体损耗随着铜箔粗糙度的增加而增加，可为封装基板制造过程中的铜箔质量控制提供参考。该研究揭示了 BF 材料的物理性能和结构特征对信号传输损耗的影响机制，可为封装基板设计提供参考。

首页

期刊简介

编委会

作者中心

审稿中心

读者中心

伦理规范

最新资讯

联系我们

English

>特约评述

>电子信息

>生物医药与生物医学工程

>新能源新材料

当期目录

年份

刊期

浏览排行

引用排行

下载排行