This is my blog.
呼~
原来并且在octave
里是&
Anomaly Detection异常检测算法
无监督学习
Gaussian distribution
单变量
多变量
特征之间有关系
u是中点的位置n*1
,$\sigma$是一个范围的区间n*n
单变量 VS 多变量
x = CPU load/memory
单变量更便宜
多变量,特征之间存在关系,并且需满足样本数量大于特征数量(一般来说m>=10n),否则不可逆
Fraud detection
对于异常检测算法未分类好的,可以再进行观察,找出新的特征
异常检测算法 VS 监督学习算法
当正样本数和负样本数都很大的时候用监督学习算法;而当正样本数很大,但负样本数(y=1)很小的时候(0-20 is common),则用异常检测算法
因为监督算法可以知道负样本的特征大概是怎样的,而且测试样本的负样本会和他很相似
但是异常检测算法中我们并不能很好的知道负样本是如何的,所以我们只能通过排除法来确定,并且负样本的样子很可能完全和训练集不同
If you have a large labeled training set with many positive examples and many negative examples, the anomaly detection algorithm will likely perform just as well as a supervised learning algorithm such as an SVM.
Collaborative Filter协同过滤算法
利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
|
|
当有新用户加入时,可以通过Mean Normalization
(归一化)
低秩矩阵向量分解
后记
啊~为什么我那么磨叽呢!
明天我一定要正常起床
绝对不赖床
如果我明天勤快点的话
就可以结课了
但我总有一种不详的预感
我还是赶快去写操作系统作业吧
然后就可以
嘿嘿嘿 看小哥哥啦
不对 还要shopping!!!
唉,女人呐!
转载请注明出处,谢谢。
愿 我是你的小太阳