Machine-Learning-week9

This is my blog.

呼~

原来并且在octave里是&

Anomaly Detection异常检测算法

无监督学习

Gaussian distribution

单变量

多变量

特征之间有关系

u是中点的位置n*1,$\sigma$是一个范围的区间n*n

单变量 VS 多变量

x = CPU load/memory

单变量更便宜

多变量,特征之间存在关系,并且需满足样本数量大于特征数量(一般来说m>=10n),否则不可逆

Fraud detection

对于异常检测算法未分类好的,可以再进行观察,找出新的特征

异常检测算法 VS 监督学习算法

当正样本数和负样本数都很大的时候用监督学习算法;而当正样本数很大,但负样本数(y=1)很小的时候(0-20 is common),则用异常检测算法

因为监督算法可以知道负样本的特征大概是怎样的,而且测试样本的负样本会和他很相似

但是异常检测算法中我们并不能很好的知道负样本是如何的,所以我们只能通过排除法来确定,并且负样本的样子很可能完全和训练集不同

If you have a large labeled training set with many positive examples and many negative examples, the anomaly detection algorithm will likely perform just as well as a supervised learning algorithm such as an SVM.

Collaborative Filter协同过滤算法

利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

1
2
3
4
5
6
7
while(true){
guess some parameter of the user favor
use “collaborative filter” to get the features of movie,
“content-based recommender system” to get a more accurate parameter of user
}

当有新用户加入时,可以通过Mean Normalization(归一化)

低秩矩阵向量分解

后记

啊~为什么我那么磨叽呢!

明天我一定要正常起床

绝对不赖床

如果我明天勤快点的话

就可以结课了

但我总有一种不详的预感

我还是赶快去写操作系统作业吧

然后就可以

嘿嘿嘿 看小哥哥啦

不对 还要shopping!!!

唉,女人呐!

转载请注明出处,谢谢。

愿 我是你的小太阳

买糖果去喽