设为首页 加入收藏

TOP

朴素贝叶斯算法在垃圾邮件过滤中的应用
2015-07-24 10:44:23 来源: 作者: 【 】 浏览:1
Tags:朴素 贝叶斯 算法 垃圾 邮件 过滤 应用

由于最近在写一篇关于大数据分类的论文(吐槽一下:导师天天催),所以在图书馆借了几本有关大数据的书籍。今天看《New Internet 大数据挖掘》(感兴趣的可以看一下)中提到垃圾邮件过滤,让我联想到昨天在1280社区看到一道名企面试题,“在游戏实时交流中,怎么过滤那些广告?”。当时想到的是关键词过滤,也没细想。

其实垃圾邮件过滤跟广告过滤是一种,使用最多的是朴素贝叶斯算法。

贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。

P(A

(参见维基百科http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86)

通过对大量已经判定的垃圾邮件和正常邮件进行学习,根据两种邮件中相同词语出现的概率对比来确定垃圾邮件的可能性。优点是准确率高,缺点是需要大量的历史数据。

<script type="text/java script">
<script type="text/java script">BAIDU_CLB_fillSlot("771048");
点击复制链接 与好友分享! 回本站首页
<script> function copyToClipBoard(){ var clipBoardContent=document.title + '\r\n' + document.location; clipBoardContent+='\r\n'; window.clipboardData.setData("Text",clipBoardContent); alert("恭喜您!复制成功"); }
<script>window._bd_share_config={"common":{"bdSnsKey":{},"bdText":"","bdMini":"2","bdMiniList":false,"bdPic":"","bdStyle":"0","bdSize":"24"},"share":{}};with(document)0[(getElementsByTagName('head')[0]||body).appendChild(createElement('script')).src='http://bdimg.share.baidu.com/static/api/js/share.js?v=89860593.js?cdnversion='+~(-new Date()/36e5)];
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇redis源码分析(一)内存管理 下一篇hibernate用hql做中文排序

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容:

·在 Redis 中如何查看 (2025-12-26 03:19:03)
·Redis在实际应用中, (2025-12-26 03:19:01)
·Redis配置中`require (2025-12-26 03:18:58)
·Asus Armoury Crate (2025-12-26 02:52:33)
·WindowsFX (LinuxFX) (2025-12-26 02:52:30)