基于 R 语言的朴素贝叶斯介绍与实践
假设你是一名政治科学家,接下来我们将通过建立和评估朴素贝叶斯模型的性能来预测政党的隶属关系,使用 20 世纪 80 年代中期的常见的投票模式来预测美国国会议员是民主党人还是共和党人。你有国会议院每个成员的投票记录并可以找出你认为最能分出两党的 16 张关键选票。你的工作是根据国会议员全年的投票情况训练一个朴素贝叶斯模型来预测一个国会议员是民主党人还是共和党人。
首先,加载 R 包。
library(mlr)
library(tidyverse)
2.1 加载和探索 HouseVotes84 数据集
该数据集位于 mlbench 包中,加载数据并将其转换为 tibble 格式。
data(HouseVotes84, package = "mlbench")
votesTib <