算法阅读：OcVFDT

2012-11-01

论文原文：

OcVFDT: One-class Very Fast Decision Tree for One-class Classiﬁcation of Data Streams. SensorKDD-2009

下面是阅读论文的笔记：

Problem:

只解决One-class的分类问题；
train set：一部分instance的class为A，剩余instance为unknown；这两类instance在data stream中服从均匀分布；（对于已经明确class为非A的instance，直接丢弃，不计入train set）
算法目前只处理离散属性，对于连续属性，可以先进行离散化处理在使用此算法；
不能处理concept drift；
内存空间有限，只扫描一次数据；
能够处理海量数据；
基于算法：VFDT和POSC4.5；

OcVFDT基于VFDT的改进，本质仍然是决策树，但与VFDT不同的是：

疑问：OcVFDT是怎样被创造出来的？

难道是巧合，闭着眼睛瞎尝试，然后走了运，出了个算法？不是的，有依据，即使是一个证据不充分的灵感，那也是最初这样尝试的依据。

下面将深入分析OcVFDT算法的最初产生依据：（未完，待续）

原文地址：https://ningg.top/algorithm-ocvfdt/

点击:联系我

微信公众号 ningg, 联系我