新的人工智能模型打破了跨模态机器视觉学习的障碍

来源：生活2024-09-30 11:17:51

导读近日，中国科学院合肥物质科学研究院王洪强教授课题组提出了一种跨模态的宽范围机器视觉AI模型。该模型克服了传统单领域模型在处理跨模态信...

近日，中国科学院合肥物质科学研究院王洪强教授课题组提出了一种跨模态的宽范围机器视觉AI模型。

该模型克服了传统单领域模型在处理跨模态信息的局限性，实现了跨模态图像检索技术的新突破。

跨模态机器视觉是人工智能领域的一大挑战，因为它涉及寻找不同类型数据之间的一致性和互补性。传统方法侧重于图像和特征，但受到信息粒度和数据不足等问题的限制。

与传统方法相比，研究人员发现详细关联在保持不同模态之间的一致性方面更为有效。该研究成果已发布到arXiv预印本服务器。

研究中，团队引入了广域信息挖掘网络(WRIM-Net)，该模型通过创建全局区域交互，提取空间、通道、尺度等不同域的详细关联，强调广域范围内的模态不变信息挖掘。

此外，研究团队还通过设计跨模态关键实例对比损失，引导网络有效提取模态不变信息。实验验证表明，该模型在标准和大规模跨模态数据集上均有效，首次在多个关键性能指标上达到90%以上。

研究团队表示，该模型可应用于人工智能的各个领域，包括视觉追踪与检索、医学图像分析等。

关键词：

首页 > 生活 > 正文

新的人工智能模型打破了跨模态机器视觉学习的障碍

猜你喜欢

最新文章

点击排行

新的人工智能模型打破了跨模态机器视觉学习的障碍

民航总局投诉热线 12369（今日时讯民航总局投诉电话）

绿萝花有什么功效和作用（2024年绿萝花的功效与作用及食用方法）

开盘半小时沪深300ETF成交超80亿元

对冲基金Glenview将与CVS高管会面提出改善运营的建议

天外来客ⅰ（2024年天外来客）

春娇与志明什么时候出的歌（2024年春娇与志明总共几部）

2024年中国第一足球网球员是谁（2024年中国第一足球网）

股债"跷跷板"效应显现…

泰康中证A500ETF成立规模20亿元

热门文章

股票打新时间表（今日时讯股票打新股要哪些条件）

中国电信itv机顶盒设置（2024年电信ITV机顶盒的设置）

2024年被司马迁称为礼仪之大宗的先秦著作是哪一年（2024年被司马迁称为礼仪之大宗的先秦著作是）

人物传记开头应该怎么写（今日时讯人物传记怎么写开头）

情深深雨蒙蒙新剧（今日时讯情深深雨蒙蒙演员表翻拍什么时候上映）

十四大确定的经济体制改革目标是什么（2024年党的十四大明确了我国经济体制改革的目标是）

三人行等成立先进装备投资基金合伙企业

平均值的算法公式（2024年平均值定理）

大阪松百度百科（2024年大坂松）

导墙做法（2024年导墙是什么）

首页 > 生活 > 正文

新的人工智能模型打破了跨模态机器视觉学习的障碍

猜你喜欢

最新文章

点击排行

新的人工智能模型打破了跨模态机器视觉学习的障碍

民航总局投诉热线 12369（今日时讯民航总局投诉电话）

绿萝花有什么功效和作用（2024年绿萝花的功效与作用及食用方法）

开盘半小时 沪深300ETF成交超80亿元

对冲基金Glenview将与CVS高管会面 提出改善运营的建议

天外来客ⅰ（2024年天外来客）

春娇与志明什么时候出的歌（2024年春娇与志明总共几部）

2024年中国第一足球网球员是谁（2024年中国第一足球网）

股债"跷跷板"效应显现…

泰康中证A500ETF成立 规模20亿元

热门文章

股票打新时间表（今日时讯股票打新股要哪些条件）

中国电信itv机顶盒设置（2024年电信ITV机顶盒的设置）

2024年被司马迁称为礼仪之大宗的先秦著作是哪一年（2024年被司马迁称为礼仪之大宗的先秦著作是）

人物传记开头应该怎么写（今日时讯人物传记怎么写开头）

情深深雨蒙蒙新剧（今日时讯情深深雨蒙蒙演员表翻拍什么时候上映）

十四大确定的经济体制改革目标是什么（2024年党的十四大明确了我国经济体制改革的目标是）

三人行等成立先进装备投资基金合伙企业

平均值的算法公式（2024年平均值定理）

大阪松百度百科（2024年大坂松）

导墙做法（2024年导墙是什么）

开盘半小时沪深300ETF成交超80亿元

对冲基金Glenview将与CVS高管会面提出改善运营的建议

泰康中证A500ETF成立规模20亿元