风帕克风机有限公司

风帕克风机;透浦式鼓风机;台湾中压风机;环保处理;粉尘处理机...
93

VIP会员

风帕克风机有限公司

张云蕾 (先生)

经营模式: 生产型

主营业务: 风帕克风机;透浦式鼓

所在地区: 上海市-松江区-九亭镇

已认证:    

收藏店铺
网站公告
风帕克风机有限公司(上海利楷机电设备有限公司)专业从事高科技的各种工业鼓风机与减速机的销售。近年来肩负着顾客们对产品质量与价格的追求,实现效率的最大化和提供广泛的技术资源等方面做着不懈的努力。 公司奉行品质第一、顾客满意的经营理念,不断吸纳专业人才,使得公司始终拥有一批掌握业界高端技术的科技人才。公司以积极务实的作风,借鉴各种先进的管理经验,不断引进国外先进设备实现自我完善,建立起良好的企业文化。目前产品有两大系列,风帕克风机系列有2HB高压鼓风机系列,4HB高压鼓风机系列,CX透浦式鼓风机系列,TB透浦式鼓风机系列,HTB透浦式鼓风机系列,FAB/FABR 斜齿系列、FAD/FADR中空斜齿系列、FABZ 直齿系列、FPG/FPGA 直齿系列等。客户的服务和技术选型,同时在上海有大量的库存备货来满足市场的需求, 配备选型工程师数名,欢迎来电大陆电话021-37773621
产品分类
联系方式
  • 联系人:张云蕾
  • 电话:86-021-37773621
  • 邮件:2881342753@qq.com
  • 手机:15900427838
  • 传真:021-57648206
友情链接
正文
香港雷锋论坛网香港中文大学陈恺:物体检测算法的近期发展及开源
发布时间:2019-10-03        浏览次数:        

  雷锋网 AI 科技评论按:物体检测是计算机视觉的基础任务之一。香港中文大学多媒体实验室博士生陈恺在

  雷锋网 AI 科技评论按:物体检测是计算机视觉的基础任务之一。香港中文大学多媒体实验室博士生陈恺在 AI 研习社的公开课上,为大家总结了深度学习背景下物体检测算法的发展,分享 COCO 比赛冠军团队所使用的算法,并介绍由港中大多媒体实验室开源的物体检测算法框架 mmdetection。

  我叫陈恺,来自香港中文大学多媒体实验室。我 2015 年从清华大学自动化系本科毕业,之后进入香港中文大学多媒体实验室读博,现在是博士四年级,导师是林达华老师。研究方向主要是物体检测、视频分析。

  对于物体检测,有的人可能比较了解,有的人可能还不怎么清楚,这里我借用 COCO dataset 论文(论文查看地址:)里面的 4 张图来形象地介绍一下相关的任务:

  Image classification:图像分类,这个任务指的是给出一张图片,要识别出哪张图片属于哪个类别。

  Object detection:物体检测,这个任务除了需要识别出图片属于哪个类别,还需要对相应的物体进行具体位置的定位,我们通常用矩形框来框出这个物体。

  Semantic segmentation:语义分割,这个任务是指对图片中的每个 pixel 打上标签,比如这里要给它们打上 person、sheep、dog 的标签,需要进行非常精细的分类。

  Instance segmentation:实例分割,可以理解为进行物体检测后,对每个矩形框中的物体进行语义分割,该任务除了需要找到物体的类别和位置之外,还需要分辨出不同物体的 pixel。

  (关于这个案例的具体讲解,请回看视频 00:04:05-00:05:35 处)

  上面绿色的字体表示的是 Two-stage Detector 的发展历程,当然还有很多其他的方法,这里列出的是一些比较有代表性的方法。

  2014 年有一项很重要的工作是 R-CNN,它是将物体检测首次应用于深度学习中的一篇论文,引用量非常高,影响也非常广泛。它的主要思路是将物体检测转化为这么一个问题:首先找到一个 region(区域),然后对 region 做分类。之后作者又提出了 Fast R-CNN,它是一个基于 R-CNN 的算法,运算速度显著提高。

  2016 年,代季峰等人提出了 R-FCN,118图库九龙图库 以求获得。它在 Faster R-CNN 的基础上进行了改进,当时它在性能和速度都有非常大的提高。

  下面会讲一下物体检测近期(2017 年以来)的工作。由于 Faster R-CNN 是很多方法的基础,我们首先会介绍一下这个方法。

  在此之前,先讲一下物体检测一般的 pipeline。下图是一个 Two-stage Detector,它的 pipeline 首先有一张图片,之后的步骤共分为三个部分:

  (对于该部分的具体讲解,请回看视频 00:12:00:00:16:25 处)

  下图中的 4 张图代表了基于单个或多个 feature map 来做预测的 4 种不同的套路:

  RoIAlign:在 Mask R-CNN 之前,大家用得比较多的是 Rol Pooling,实现过程是:给出一个框,在 feature map 上 pool 出一个固定大小的 feature,比如要 pool 一个 2×2 的 feature,首先把这个框画出 2×2 的格子,每个格子映射到 feature map,看它覆盖了多少个点,之后对这些点做 max pooling,这样就能得出一个 2×2 的 feature。它的劣势是如果框稍微偏一点,得出的 feature 却可能是一样的,存在截断误差。Rol Align 就是为了解决这一问题提出的。Rol Align 并不是直接对框内的点做 max pooling,而是用双线性插值的方式得到 feature。其中还有一步是:在 2×2 的每个框中会选择多个点作为它的代表,这里选择了 4 个点,每个点分别做双线 个点做 max/average pooling。

  Mask branch:它是一个非常精细的操作,也有额外的监督信息,对整个框架的性能都有所提高。它的操作过程如下图所示:

  Cascade R-CNN 的结构是,在经过第一次分类和回归之后,会用得到 bounding box 再来做一次 pooling,然后对这些框做下一阶段的分类和回归,这个过程可以重复多次。但如果仅仅使用 Cascade R-CNN 而不做其他改变,Cascade R-CNN 带来的提高是非常有限的。

  基于此,Cascade R-CNN 就提出了在不同的 stage 怎样进行训练的问题。下图是 3 个 stage 的框的分布:

  RetinaNet 的结构 和 SSD 非常类似,只不过它用的是 ResNet,并在 ResNet 上加入了 FPN 的结构,每一层都有两个分支:一个用来做分类;另一个用来做框回归。此外它的每个 head 都比 SSD 和 Faster R-CNN 都要大一点,这样的话,它的参数量比较大,计算速度也比较慢。

  Focal loss 的核心思路是:对于 high confidence 的样本,给一个小的 loss——这是因为正负样本不平衡,或者说是由于 class imbalance 导致了这样的问题:比如说正负样本的比例是 1:1000,虽然负样本的 loss 都很小,但数目非常多,这些负样本的 loss 加起来的话,还是比正样本要多——这样的话,负样本就会主导整个框架。其具体公式表示如下图所示:

  它的核心思想是:当前框的 feature 除了由当前框决定之外,还要考虑当前框和周围框及其它框的关系,具体怎样计算,大家感兴趣的话可以阅读论文原文了解。

  CornerNet,是 Singe-stage Detector 中比较新的方法,其与其他方法最不一样的地方是:之前的方法会在图像上选出框,再对框做分类的问题;CornerNet 则是在图中找到 pair 的关键点,这个点就代表物体。它的 pipeline 包括两步:第一步是检测到这样的 corner,2018年藏宝图。即 keypoint;第二步是 group corner,就是说怎样将同一个物体的左上顶点和右下顶点框到一起。

  我们实验室和商汤一起参加了 COCO Challenge 2018 比赛,然后在实例分割中取得了第一名的成绩。

  下图展示了我们本次取得的成绩与 2017 年的冠军团队取得的成绩的比较:

  但这种方法的问题是:每个 stage 的 branch 都做并行的 prediction,彼此间没有任何交集。

  基于这些调整和改进,HTC 最终的 performance 如下图所示:

  无论是在小模型 ResNet-50 上还是大模型 ResNeXt-101 上,它的性能都有非常稳定的提升。

  FishNet 这个工作的论文被 NIPS 2018 收录了。它的想法是:对于图像分类来说,需要的是深层的、低分辨率的特征,而不考虑空间上的信息;但是对于 segmentation 和 detection 来说,需要空间上的信息,因此需要的是深层的和高分辨率的特征,因此我们就将这两种思路结合起来设计了 FishNet。具体设计大家可以参考论文。

  (关于这三个工作的具体讲解,请回看视频 00:49:00-00:59:40 处)

  (关于比赛细节的详细讲解,请回看视频 00:59:50-01:01:40)

  最后我介绍一下 Open-MMlab 的这个项目。林达华老师在 MMLAB 知乎专栏(地址:)里对这个项目进行过介绍。

  (关于这两个项目的具体讲解,请回看视频 01:02:10-1:04:25-处。)

  分享最后,嘉宾还对各位同学们的提问进行了回答,大家可回看视频 01:04:30 处

  以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网 AI 研习社社区()观看。关注微信公众号:AI 研习社(okweiwu),可获取最新公开课直播时间预告。雷锋网

  标签:r-cnn 深度学习 faster 香港中文大学 detector proposal 论文 region 框架 回看 大讲堂 实验室 年有 物体检测算法的近期发展 公开课 冠军 陈恺 雷锋网 图像 多媒体