2019年6月13日讨论班报告
各位老师,同学:
时间:6月13日讨论班 9:00-10:30
地点:教学楼5-308
报告内容:
弭娜 The Controller Placement Problem
诸如软件定义网络(SDN)之类的网络架构将控制逻辑从分组处理设备移动到外部控制器(controller)上。与传统的纯分布式系统相比,这些具有解耦控制平面的网络架构在可靠性、可扩展性和性能方面带来了许多未解决的问题。本文通过关注两个具体问题来开展调查:给定拓扑,需要多少个控制器?它们应该放在哪里? 为了回答这些问题,我们研究了在即将到来的Internet2生产部署中控制平面传播延迟的基本限制,然后将我们的范围扩展到100多个可公开使用的WAN拓扑。正如所料,答案取决于拓扑结构。 更令人惊讶的是,一个控制器位置通常足以满足现有的响应时间要求。
张忠凯 Synthetic oversampling with the majority class: A new perspective on handling extreme imbalance
在各领域,类不平衡问题是一个广泛的问题。通过生成合成数据扩充稀少类的样本数量是解决类不平衡问题的最常用的方法之一。然而,现有方法一般关注少数类的特征,并利用这些特征来指导过采样过程。但全然忽视了多数类,他们丢失了解决分类问题的全局视角,并且在缓解类不平衡的同时,可能生成了重叠实例从而对可学习性产生负面影响。这个问题在极度类别不平衡时变得更加危急,少数类的代表性不足,而且其本身并不包含足够的信息来进行过采样过程。本文提出了一种合成过采样的新方法,它利用多数类中固有的丰富信息来合成少数类数据。这是通过生成与已知少数类实例具有相对多数类相同的马氏距离的合成数据来完成的。我们评估了26个基准数据集,结果显示本方法与现有的最新过采样方法相比有独特的性能提升。
下周报告人 闵新平,柏欣雨